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第 1 章 FR 


在 本 书 的 开篇 ， 我 们 首先 概要 地 介绍 C 语言 ， 主 要 是 通过 实际 的 程序 
引入 C 语言 的 基本 元素， 至 于 其 中 的 具体 细 市 、 规 则 以 及 一 些 例外 情 
况 ， 在 此 暂时 不 多 做 讨论 。 因 此 ， 本 章 不 准备 完整 、 详 细 地 讨论 C 语 
言 中 的 一 些 技术 (当然 ， 这 里 所 举 的 所 有 例子 都 是 正确 的 )。 我 们 是 布 
望 读 者 能 尽快 地 编写 出 有 用 的 程序 ， 为 此 ， 本 章 将 重点 介绍 一 些 基 本 
概念 ， 比 如 变量 与 常量 、 算 术 运 算 、 控 制 流 、 画 数 、 基 本 输入 /输出 
等 。 而 对 于 编写 较 大 型 程序 所 涉及 到 的 一 些 重 要 特性 ， 比 如 指针 、 结 
构 、C 语言 中 十 分 丰富 的 运算 符 集 合 、 部 分 控制 流 语句 以 及 标准 库 

， 本 章 将 暂 不 做 讨论 。 


这 种 讲解 方式 也 有 缺点 。 应 当 提 请 注意 的 是 ， 在 本 章 的 内 容 中 无 法 找 
到 任何 特定 语言 特 性 的 完整 说 明 ， 并 且 ， 由 于 比较 简略 ， 可 能 会 使 读 
者 产生 一 些 误解 ;再 者 ， 由 于 所 举 的 例子 并 没有 用 到 C 语言 的 所 有 强 
KAHE, AE, KERTEH ER o BARICA DK 
这 些 问题 的 影响 降 到 最 低 ， 但 问题 肯定 还 是 存在 。 男 一 个 不 足 之 处 在 
于 ， 本 章 所 讲 的 某 些 内 容 在 后 续 相 关 章 世 还 必须 再 次 讲述 。 我 们 布 户 
这 种 重复 给 读者 市 来 的 帮助 效果 远 远 超过 它 的 负面 影响 。 

无 论 是 利 还 是 刺 ， 一 个 经 验 丰 富 的 程序 员 应 该 可 以 从 本 章 介绍 的 内 容 
中 推 知 他 们 目 己 进 行程 序 设计 所 需要 的 一 些 基本 元 素 。 初 学 者 应 编写 
一 些 类 似 的 小 程序 作为 本 草 内 容 的 补充 练习。 无 论 是 经 验 丰 富 的 程序 
员 还 是 初学 者， 都 可 以 把 本 章 作 为 后 续 各 章 详细 讲解 的 内 容 的 框 。 


1.1 入 门 


学 习 一 | 新 程序 设计 语言 的 惟一 途径 就 是 使 用 它 编写 程序 。 对 于 所 有 
语言 的 初学 者 来 说 ， 编写 的 第 一 个 程序 几乎 都 是 相同 的 ， 即 : 


请 打印 出 下 列 内 容 
hello, world 


尽管 这 个 练习 很 商 单 ， 但 对 于 初学 语言 的 人 来 说 ， 它 仍然 可 能 成 为 一 
大 障碍 ， 因 为 要 实 现 这 个 目的 ， 我 们 首先 必须 编写 程序 文本 ， 然 后 成 


a 


功 地 运行 编译 ， 并 加 载 、 运 行 ， 最 后 输出 BIR MTT o Ste SEER 
作 细 市 以 后 ， 其 它 事情 束 比 较 容 易 了 。 


在 C 语言 中 ， 我 们 可 以 用 下 列 程序 打印 出 “ hello, world": 


#include <stdio.h> 


main() 

{ 

printf("hello, world\n"); 
} 


如 何 运 行 这 个 程序 取决 于 所 使 用 的 系统 。 这 里 举 一 个 特殊 的 例子 。 在 
UNIX 操作 系统 中 ， 


首先 必须 在 某 个 文件 中 建立 这 个 源 程序 ， 并 以 “ .c" 作 为 文件 的 扩展 
名 ， 例 如 hello.c， 然 后 再 通过 下 列 命 令 进 行 编译 : 


cc hello.c 


如 果 源 程序 没有 什么 错误 (例如 决 挥 字符 或 拼 错 子 人 符 )， 编 译 过 程 将 顺 
利 进 行 ， 并 生成 一 个 可 执行 文件 a.out。 然 后 ， 我 们 输入 : 


a.out 


即 可 运行 aout， 打 印 出 下 列 信息 : hello, world 


其 它 操 作 系统 中 ， 编 译 、 加 载 、 运 行 等 规则 会 有 所 不 同 。 
#include <stdio.h> main() 

{ 

printf("hello, world\n"); 

} 


包含 标准 库 的 信息 定义 名 为 main 的 函数 ， 它 不 接受 参数 值 main 函数 
的 语句 都 被 括 在 花 括号 中 


main EAA Val FA ee Ew Av printf 以 显示 字符 序列 ; 
代表 换行 符 


第 
一 个 C 语言 程序 


下 面 对 程序 本 身 做 些 说 明 。 一 个 C 语言 程序 ， 无 论 其 大 小 如 何 ， 都 是 
由 函数 和 变量 组 成 的 。 画 数 中 包含 一 些 语句 ， 以 指定 所 要 执行 的 计算 
操作 ;变量 则 用 于 存储 计算 过 程 中 使 用 的 值 。C 语言 中 的 函数 类 似 于 

Fortran 语言 中 的 子 程序 和 函 数 ， 与 Pascal 语言 中 的 过 程 和 函数 也 很 类 
似 。 在 本 例 中 ， 画 数 的 名 字 为 main。 通 常情 况 下 ， 函 数 的 命名 没有 限 


制 ， 但 main 是 一 ARRIKA ——BE FEF eB main 芳 数 的 起 点 
开始 执行 ， 这 意味 着 每 个 程序 都 必须 在 某 个 位 置 包含 一 个 main K 


数 


main 函数 通常 会 调用 其 它 函 数 来 帮助 完成 某 些 工作 ， 被 调用 的 函数 可 
oe 目 己 编 写 的 ， 也 可 以 来 和 目 于 函数 库 。 上 壕 程 序 段 中 
` Cm H 


#include <stdio.h> 
用 于 告诉 编译 器 在 本 程序 中 包含 标准 输入 /输出 库 的 信息 。 许 多 C 语言 


源 程 序 的 开始 处 都 包 含 这 一 行 语句 。 我 们 将 在 第 7 章 和 附录 B 中 对 标 
准 库 进 行 详细 介绍 。 


函数 之 间 进 行 数据 交换 的 一 种 方法 是 调用 函数 疝 被 调用 函数 提供 一 个 
值 ( 称 为 参数 ) 列 表 。 画 数 名 后 面 的 一 对 圆 括号 将 参数 列表 括 起 来 。 在 
本 例 中 ，main 函数 不 需要 任何 参数 ， 因 此 用 空 参数 表 () 表 示 。 


函数 中 的 语句 用 一 对 花 括 吕 { 括 起 来 。 本 例 中 的 main 函数 仅 包含 下 面 


一 条 语句 |: 


printf("hello, world\n"); 


调用 函数 时 ， 只 需要 使 用 函数 名 加 上 用 圆 括 号 括 起 来 的 参数 表 即 可 。 
上 面 这 条 语句 将 "hello, world\n"。 作 为 参数 调用 printf KZ ° printf 是 
一 个 用 于 打印 输出 的 库 函 数 ， 在 此 处 ， 它 打印 双 引 号 中 间 的 字符 串 。 


用 双 引 号 括 起 来 的 字符 序列 称 为 字符 串 或 字符 串 常量 ， 如 "hello， 
a 字符 串 。 目 前 我 们 仅 使 用 字符 串 作为 printf KEE K 
BHA BX © 


在 C 语言 中 ， 字 符 序 列 m RAT, ZTE ISSEY, FFT ED 
将 换行 ， 从 下 一 行 的 左 端 行 首开 始 。 如 采 去 抒 字 符 串 中 的 (这 是 个 值 
得 一 做 的 练习 )， 即 使 输出 打印 完成 后 也 


` 会 换行 。 在 printf KRISH, RAEM RRITET o UNRATE 
序 的 换行 代替 mm， 例 如 : 


printf("hello, world "); 
C 编译 器 将 会 产生 一 条 错误 信息 。 


printf 函数 永远 不 会 目 动 换行 ， 这 样 我 们 可 以 多 次 调用 该 函数 以 分 阶段 
得 到 一 个 长 的 输 出 行 。 上 面 给 出 的 第 一 个 程序 也 可 以 改写 成 下 列 形 式 : 


#include <stdio.h> 


main() 
{ 

printf("hello, "); 

printf("world"); 

printf("\n"); 

} 

这 上 段 程序 与 前 面 的 程序 的 输出 相同 。 

请 注意 ，\n 只 代表 一 个 字符 。 类 似 于 \n 的 转 义 字符 序列 为 表示 无 法 输 
入 的 字符 或 不 可 见 字符 提供 了 一 种 通用 的 可 扩充 的 机 制 。 除 此 之 外 ， 


C 语言 提供 的 转 义 字符 序列 还 包括 :Y 表 示 制 表 符 ;\b 表示 回 退 符 ;'"' 表 示 
DE E 


练习 161 在 你 自己 的 系统 中 运行 “ hello, world" 程 序 。 再 有 意 去 掉 程 序 
中 的 部 分 内 容 ， 看 看 会 得 到 什么 出 错 信 息 。 


练习 1°2 做 个 实验 ， 当 printf 函数 的 参数 字符 串 中 包 合 \c( 其 中 c 是 上 
面 的 转 义 字符 序列 中 未 曾 列 出 的 某 一 个 字符 ) 时 ， 观 察 一 下 会 出 现 什 


么 情况 。 


1.2 变量 与 算术 表达 式 


我 们 来 看 下 一 个 程序 ， 使 用 公式 c=(5/9)(F*32) 打 印 下 列 华氏 温度 与 摄氏 
温度 对 照 表 : 
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此 程序 中 仍然 只 包括 一 个 名 为 main 的 函数 定义 。 它 比 前 面 打 印 * 
hello, world" 的 程序 


长 一 些 ， 但 并 不 复杂 。 这 个 程序 中 引入 了 一 些 新 的 概念 ， 包 括 注 释 、 
声明 、 变 量 、 算 术 表 达 式 、 循 环 以 及 格式 化 输出 。 该 程序 如 下 所 示 : 


#include <stdio.h> 


/* 4 fahr=0, 20, ..., 300 时 ,分别 打印 华氏 温度 与 摄氏 温度 对 照 表 
*/ 


main() 
{ 
int fahr, celsius; 


int lower, upper, step; 


lower = 0; /* 温度 表 的 下 限 */ upper = 300; /* 温度 表 的 上 限 */ step = 
20; /* atk */ 


fahr = lower; 
while (fahr <= upper) { 


celsius = 5 * (fahre32) / 9; printf("%d\t%d\n", fahr, celsius); fahr = fahr + 
step; 


} 
} 
其 中 的 两 行 : 


/* 当 fahr=0，20，... ，300 时 ， 分 别 打印 华氏 温度 与 摄氏 温度 对 照 表 
*/ 


称 为 注释 ， 此 处 ， 它 简单 地 解释 ， 该 程序 是 做 什么 用 的 。 包 含 在 /* 与 
*/ 之 间 的 字符 序列 将 被 编译 絮 忽 略 。 注 释 可 以 目 由 地 运用 在 程序 中 


使 得 程序 更 易于 理解 。 程 序 中 允许 出 现 空 格 、 制 表 符 或 换行 符 之 处 ， 
都 可 以 使 用 注释 。 


在 C 语言 中 ， 所 有 变 量 都 必须 先 声 明 后 使 用 。 声 明 通 音 放 在 函数 起 始 
处 ， 在 任何 可 执行 语句 之 前 。 声 明 用 于 说 明 变 量 的 属性 ， 它 由 一 个 类 
型 名 和 一 个 变量 表 组 成 ， 例 如 : 


int fahr, celsius; 


int lower, upper, step; 


其 中 ， 类 型 int 表示 其 后 所 列 变量 为 整数 ， 与 之 相对 应 的 ，float 表示 

所 列 变量 为 浮 点 数 ( 即 ， 可 以 带 有 小 数 部 分 的 数 )。int 与 float 类 型 的 

取 值 范围 取决 于 具体 的 机 器 。 对 于 int 类 型 ， 通常 为 16 位 ， 其 取 值 范 
围 在 ,32768 合 32767 之 间 ， 也 有 用 32 位 表示 的 int 类 型 。float 类 型 通 
ie 32 位 ， 它 至 少 有 6 MAXIT, PUA E — 107°@10" 2 

[A] 。 


除 int 5 float 类 型 之 外 ，C 语 高 还 提供 了 其 它 一 些 基本 数据 类 型 ， 例 
如 : 


char 字符 一 一 一 个 字 市 
short 短 整 型 

long 长 整 型 

double 双 精 度 浮 点 型 


这 些 数据 类 型 对 象 的 大 小 也 取决 于 具体 的 机 器 。 男 外 ， 还 存在 这 些 基 
本 数据 类 型 的 数组 、 结 构 、 联 合 ， 指 向 这 些 类 型 的 指针 以 及 返回 这 些 
类 型 值 的 画 教 。 我 们 将 在 后 续 相 应 的 章节 中 分 别 介绍 。 


在 上 面 的 温度 转换 程序 中 ， 最 开始 执行 的 计算 是 下 列 4 个 赋值 语句 : 


lower = 0; 
upper = 300; 
step = 20; fahr = lower; 


它们 为 变量 设置 初 值 。 各 条 语句 均 以 分 号 结束 。 温度 转换 表 中 的 各 行 
计算 方式 相同 ， 因 此 可 以 用 循环 语句 重复 输出 各 行 。 这 是 while 循 


环 语句 的 用 途 : 


while (fahr <= upper) { 


} 


while 循环 语句 的 执行 方式 是 这 样 的 : 首先 测 试 圆 括 号 中 的 条 件 ;如 
KR 件 为 真 (fahr<=upper)， 则 执行 循环 体 ( 括 在 花 括号 中 的 3 条 语句 ); 

然后 再 重新 测试 圆 括 号 中 的 条 件 ， 如 果 为 真 ， 则 再 次 执行 循环 体 ; 当 贺 
括号 中 的 条 件 测试 结果 为 假 (fahr>upper) 时 ， 循环 结束 ， 并 继续 执行 跟 
在 while 循环 语句 之 后 的 下 一 条 语句 。 在 本 程序 中 ， 循 环 语句 后 没有 

其 它 语 句 ， 因 此 整个 程序 的 执行 终止 。 


while 语句 的 循环 体 可 以 是 用 伦 括号 括 起 来 的 一 条 或 多 条 语句 (如 上 面 
的 温度 转换 程序 )， 也 可 以 古 不 用 伦 括号 包括 的 单条 语句 ， 例 如 : 


while (i <j)i=2 * i; 


在 这 两 种 情况 下 ， 我 们 总 是 把 由 while 控制 的 语句 缩 进 一 个 制 表 位 ， 
这 样 束 可 以 很 容易 地 看 出 循环 语句 中 包含 哪些 语句 。 这 种 缩 进 方式 突 
出 了 程序 的 逻辑 结构 。 尺 管 C 编译 做 并 不 关心 程序 的 外 观 形 式 ， 但 正 
确 的 缩 进 以 及 保留 适当 空格 的 程序 设计 风格 对 程序 的 易 读 性 非常 重 

要 。 我 们 建议 每 行 只 书写 一 条 语句 ， 并 在 运算 符 两 边 各 加 上 一 个 空格 
字符 ， 这 样 可 以 使 得 运算 的 结合 关系 更 清楚 明了 。 相 比 而 言 ， 伦 括号 
的 位 置 束 不 那么 重要 了 。 我 们 从 比较 流行 的 一 些 风 格 中 选择 了 一 种 ， 
读 痢 可 以 选择 适合 目 己 的 一 种 风格 ， 并 养 成 一 直 使 用 这 种 风格 的 好 习 


惯 。 


ea 绝 大 部 分 工作 都 是 在 循环 体 中 完成 的 。 循 环 体 中 的 赋值 
laa 

celsius = 5 * (fahr * 32) / 9: 用 于 计算 与 指定 华氏 温度 相对 应 的 摄 
氏 温 度 值 ， 并 将 结 采 赋值 给 变量 celsius。 在 该 语句 中 ， 


之 所 以 把 表达 式 写 成 完 乘 5 然后 再 除 以 9 而 不 是 直接 写成 5/9， 其 原 
因 是 在 C 语言 及 许多 


其 它 语言 中 ， 人 整数 除法 操作 将 执行 舍 位 ， 结 果 中 的 任何 小 数 部 分 都 会 
REF ° HT 5A 9# 


是 整数 ，5 /9 TERRIER ZAR 0, BERERE A x 
氏 温 度 都 将 为 0。 


从 该 例 了 于 中 也 可 以 看 出 printf 函数 的 一 些 功 能 。printf 征 一 个 通用 输出 
格式 化 函数 ， 第 7 章 将 对 此 做 详细 介绍 。 该 函数 的 第 一 个 参数 是 待 
打印 的 字符 串 ， 其 中 的 每 个 百 分 号 (%) 表示 其 它 的 参数 (第 二 个 、 第 三 
A 参数 ) 之 一 进行 奉 换 的 位 置 ， 并 指定 打印 格式 。 例 如 ，%d 指 
定 一 个 整 型 参数 ， 因 此 语 名 


printf(" %d\t%d\n", fahr celsius); 
用 于 打印 两 个 整数 fahr 5 celsius 的 值 ， 并 在 两 者 之 间 留 一 个 制 表 符 的 


空间 Qt) 。 


printf 函数 的 第 一 个 参数 中 的 各 个 % 分 别 对 应 于 第 二 个 、 第 三 个 、.……. 
参数 ， 它 们 在 数 目 和 类 型 上 都 必须 匹配 ， 否 则 将 出 现 错误 的 结 采 。 


顺便 指出 ，printf 函数 并 不 是 C 语言 本 身 的 一 部 分 ，C 语言 本 吴 并 没 
有 定义 输入 /输出 功能 。printf 仅仅 是 标准 库 函 数 中 一 个 有 用 的 函数 而 
E, QEPET KAE C 语言 程序 中 通常 都 可 以 使 用 。 但 是 ，ANSIi 
标准 定义 了 printf 函数 的 行为 ， 因 此 ， 对 每 个 符合 该 标准 的 Sa aA 
库 来 说 ， 该 函数 的 属性 都 是 相同 的 。 


为 了 将 重点 放 到 讲述 C 语言 本 身上 ， 我 们 在 第 7 章 之 前 的 各 章 中 将 不 
再 对 输入 /输出 做 更 多 的 介绍 ， 并 且 ， 竺 别 将 格式 化 输入 推 后 到 第 7 章 
讲解 。 如 有 果 读 者 想 了 解数 据 输 入 ， 可 以 先 阅 读 7.4 7 AX scanf 函数 
的 讨论 部 分 ，scanf 函数 类 似 于 printf 函数 ， 但 它 用 于 读 输 入 数据 而 不 
征 写 输出 数据 。 

上 述 的 温度 转换 程序 存在 两 个 问题 。 比 较 简 单 的 问题 是 ， 由 于 输出 的 
数 不 是 右 对 齐 的 ， 所 以 输出 的 结果 不 是 很 美观 。 这 个 问题 比较 容易 解 
决 :如 果 在 printf 语句 的 第 一 个 参数 的 


Yd 中 指明 打印 宽度 ， 则 打印 的 数字 会 在 打印 区 域内 右 对 齐 。 例 如 ， 
可 以 用 语句 


printf(" %3d %6d\n", fahr, celsius); 


打印 fahr 5 celsius 的 值 ， 这 样 ，fahr 的 值 占 3 个 数字 宽 ，celsius 的 值 
占 6 个 数字 宽 ， 输出 的 结果 如 下 所 示 : 


0 .17 
20 “6 
40 4 

60 15 
80 26 


100 37 


另 一 个 较为 严重 的 问题 是 ， 由 于 我 们 使 用 的 是 整 型 算术 运算 ， 因 此 经 
计算 得 到 的 摄氏 温 度 值 不 太 精 确 ， 例 如 ， 与 ”OF 对 应 的 精确 的 摄氏 
温度 应 该 为 .17.8C， 而 不 是 .17C。 为 了 得 到 更 精确 的 结果 ， 应 该 用 浮 
点 算术 运算 代替 上 面 的 整 型 算术 运算 。 这 就 需要 对 程序 做 适当 修改 。 
F 面 是 该 程序 的 又 一 种 版 本 


#include <stdio.h> 


/* print Fahrenheite Celsius table 
for fahr = 0, 20, ..., 300; floating*point version */ main() 
{ 


float fahr, celsius; float lower, upper, step; 


lower = 0; /* lower limit of temperatuire scale */ upper = 
300; /* upper limit */ 

step = 20; /* step size */ 

fahr = lower; 


while (fahr <= upper) { 


celsius = (5.0/9.0) * (fahre32.0); printf("%3.0f %6.1f\n", fahr, celsius); fahr 
= fahr + step; 


} 
} 
这 个 程序 与 前 一 个 程序 基本 相同 ， 不 同 的 是 ， 它 把 fahr 与 celsius 声明 


为 float 类 型 ， 转 换 公 式 的 表述 方式 也 更 目 然 一 些 。 在 前 一 个 程序 
中 ， 之 所 以 不 能 使 用 579 的 形式 ， 


E AA FE BRIAR TT UI, Ei ARH ea tt SIZE AR 0 e 
(Bre, FPA RL HACE TERE, AL, 5.0/9.0 是 
两 个 浮 点 数 相 除 ， 结 果 将 不 被 全 位 。 


如 有 果 某 个 算术 运算 和 从 的 所 有 操作 数 均 为 整 型 ， 则 执行 整 型 运算 。 但 
征 ， 如 有 果 某 个 算术 运 算 符 有 一 个 浮 点 型 操作 数 和 一 个 整 型 操作 数 ， 则 
在 开始 运算 之 前 整 型 操作 数 将 会 被 转换 为 浮 点 型 。 例 如 ， 在 表达 式 
fahr- 32 F, 32 在 运算 过 程 中 将 被 目 动 转换 为 浮 点 数 再 参与 运算 。 
不 过 ， 即 使 浮 点 常量 取 的 是 整 型 值 ， 在 书写 时 最 好 还 是 为 它 加 上 一 个 
显 式 的 小 数 点 ， 这 样 可 以 强调 其 浮 点 性 质 ， 便 于 阅读 。 


第 2 章 将 详细 介绍 把 整 型 数 转换 为 浮 点 型 数 的 规则 。 在 这 里 需要 注 
意 ， 赋 值 语句 


fahr = lower; 
与 条 件 测 试 语句 
while (fahr <= upper) 


也 都 是 按照 这 种 方式 执行 的 ， 即 在 运 滤 之 前 先 把 int 类 型 的 操作 数 转 
换 为 float 类 型 的 操作 数 。 


printf 中 的 转换 说 明 %3.0f 表明 每 打印 的 浮 点 数 ( 即 fahr) 27> 站 3 个 字 
FH, LA 市 小 数 态 和 小 数 部 分 ;%6.1f 表明 为 一 个 每 打印 的 数 
(celsius) 至 少 占 6 个 字符 宽 ， 且 小 数 点 后 面 有 1 位 数字 。 其 输出 如 下 
所 示 : 


0 °17.8 
20 °6.7 
40 4.4 


格式 次 明 可 以 省 略 宽度 与 精度 ， 例 如 ，%6f Zea PHT] PO EE 
有 6 个 字符 宽 ;%.2f 指定 行 打印 的 序 点 数 的 小 数 总 后 有 两 位 小 数 ， 但 宽 


度 没有 限制 ;%f 则 仅仅 要 求 按照 浮 点 数 打 印 该 数 。 
%d 按照 十 进 制 整 型 数 打 印 


%6d 按照 十 进 制 整 型 数 打 印 ， 至 少 6 个 字符 宽 

%f 按照 浮 点 数 打印 

%6f 按照 浮 点 数 打印 ， 至 少 6 个 字符 帘 

%.2f 按照 浮 点 数 打 印 ， 小 数 点 后 有 两 位 小 数 

按照 浮 点 数 打 印 ， 至 少 6 个 字符 宽 ， 小 数 点 后 有 两 位 小 
za 


此 外 ，printf 函数 还 支持 下 列 格 式 说 明 :%o 表示 八进制 数 ;%x 表示 十 六 
进 制 数 ;%c 表示 字符 ;%s 表示 字符 串 ;9%9% 表 示 百 分 号 (%) 本 号 。 


练习 1°3 修改 温度 转换 程序 ， 使 之 能 在 转换 表 的 顶部 打印 一 个 


标题 。 练习 104 编写 一 个 程序 打印 摄氏 温度 转换 为 相应 华氏 温 
度 的 转换 表 。 


1.3 for 语句 


对 于 对 个 特定 任务 我 们 可 以 采用 多 种 方法 来 编写 程序 。 下 面 这 段 代 码 
也 可 以 实现 前 面 的 温度 转换 程序 的 功能 : 


#include <stdio.h> 


/* 打 印 华氏 温度 一 摄氏 瘟 度 对 照 表 */ 
main() 
{ 


int fahr; 


for (fahr = 0; fahr <= 300; fahr = fahr + 20) printf("%3d %6.1f\n", fahr, 
(5.0/9.0)*(fahre32)); 


} 


这 个 程序 与 上 市 中 介绍 的 程序 执行 结 末 相 同 ， 但 程序 本 映 却 有 所 不 

同 。 最 主要 的 改进 在 于 它 去 挥 了 大 部 分 变量 ， 而 只 使 用 了 一 个 int 类 
型 的 变量 fahr。 在 新 引入 的 for 语句 中 ， 温 度 的 下 限 、 上 限 和 步 长 都 
征 常 量 ， 而 计算 摄氏 温度 的 表达 式 现在 变 成 了 printf 函数 的 第 三 个 参 
数 ， 它 不 再 是 一 个 单独 的 赋值 语句 。 

以 上 几 点 改进 中 的 最 后 一 点 是 C 语言 中 一 个 通用 规则 的 实例 :在 允许 使 
用 某 种 类 型 变量 值 的 任何 场合 ， 都 可 以 使 用 该 类 型 的 更 复杂 的 表达 
式 。 因 为 printf 函数 的 第 三 个 参数 必须 是 与 %6.1f 匹配 的 浮 点 值 ， 所 
以 可 以 在 此 处 使 用 任何 浮 点 表达 式 。 


for 语句 是 一 种 循环 语句 ， 它 是 对 while 语句 的 推广 。 如 果 将 for 语句 
与 前 面 介绍 的 while 语句 比较 ， BLE ZH for 语句 的 操作 更 直观 一 些 o 
GS PHRASE 3 个 部 分 ， 各 部 分 之 间 用 分 号 隔 开 。 第 一 部 分 

fahr = 0 

是 初始 化 部 分 ， 仅 在 进入 循环 前 执行 一 次 。 第 二 部 分 

fahr <= 300 

是 控制 循环 的 测试 或 条 件 部 分 。 循 环 控制 将 对 该 条 件 求 值 ， 如 果 结 


值 为 真 (true)， 则 执行 循环 体 (本 例 中 的 循环 体 仅 包 含 一 个 printf 函数 调 
用 语句 )。 此 后 将 执行 第 三 部 分 


fahr = fahr + 20 


以 将 循环 变量 fahr 增加 一 个 步 长 ， 并 再 次 对 条 件 求 值 。 如 采 计 算得 到 
的 条 件 值 为 假 (faise)， 循环 将 终止 执行 。 与 while 语句 一 样 ，for 循环 
语句 的 循环 体 可 以 只 有 一 条 语句 ， 也 可 以 是 用 人 花 括 号 括 起 来 的 一 组 语 
句 。 初 始 化 部 分 (第 一 部 分 )、 条件 部 分 (第 二 部 分 ) 与 增加 步 长 部 分 (第 
三 部 分 ) 都 可 以 是 任何 表达 式 。 


在 实际 编程 过 程 中 ， 可 以 选择 while 与 for 中 的 任意 一 种 循环 语句 ， 
主要 要 看 使 用 哪 一 种 更 清晰 。for 语句 比较 适合 初始 化 和 增加 步 长 都 
是 单条 语句 并 且 逻 辑 相 关 的 情形 ， 因 为 它 将 循环 控制 语句 集中 放 在 一 
€, HHE while 语句 更 紧凑 。 


练习 1°5 修改 温度 转换 程序 ， 要 求 以 逆序 ( 即 按照 从 300 度 到 0 度 的 顺 
序 ) 打 印 温 度 转 换 表 。 


1.4 符号 常量 


在 结束 讨论 温度 转换 程序 前 ， 我 们 再 来 看 一 下 符号 常量 。 在 程序 中 使 

用 300、20 等 类 似 的 "2] 数 "并 不 是 一 个 好 习惯 ， 它 们 几乎 无 法 向 以 后 

阅读 该 程序 的 人 提供 什么 信息 ， 而 且 使 程序 的 修改 变 得 更 加 困难 。 处 
理 这 种 么 ] 数 的 一 种 方法 是 赋予 它们 有 意义 的 名 了 字 。#define 指令 可 以 把 
符号 名 (或 称 为 符号 常量 ) 定 义 为 一 个 特定 的 字符 串 : 


#define 名 字 ARMA 


在 该 定义 之 后 ， 程 序 中 出 现 的 所 有 在 #define 中 定义 的 名 字 ( 既 没有 用 
引号 引起 来 ， 也 不 是 其 它 名 字 的 一 部 分 ) 痢 将 用 相应 的 车 换文 本 蔡 

换 。 其 中 ， 名 字 与 普通 变量 名 的 形式 相同 : 它 们 都 是 以 字母 打 汰 的 字母 
和 数字 序列 ; 奉 换 文本 可 以 是 任何 子 符 序列 ， 而 不 仅 限 于 数字 。 


#include <stdio.h> 


sin LOWER o /* lower limit of table */ 
pine UPPER wp upper limit */ 


pein STEP |20 |/* step size */ 


/* print Fahrenheit*Celsius table */ main() 
{ 
int fahr; 


for (fahr = LOWER; fahr <= UPPER; fahr = fahr + STEP) printf("%3d 
%6.1f\n", fahr, (5.0/9.0)*(fahre32)); 


} 

EH, LOWER ` UPPER 5 STEP 都 是 符号 常量 ， 而 非 变量 ， 因 此 不 
需要 出 现在 声明 中 。 符 号 常量 名 通常 用 大 写字 母 拼 写 ， 这 样 可 以 很 容 
易 与 用 小 写字 母 拼 写 的 变量 名 相 区 别 。 注 意 ， 


#define 指令 行 的 末尾 没有 分 号 。 


1.5 字符 输入 /输出 


接 下 来 我 们 看 一 组 与 字符 型 数据 处 理 有 关 的 程序 。 读 者 将 会 发 现 ， 许 
多 程序 只 不 过 是 这 里 所 讨论 的 程序 原型 的 扩充 版 本 而 已 。 


标准 库 提 供 的 输入 /输出 模型 非常 滑 单 。 无 论文 本 从 何 处 输入 ， 输 出 到 
何 处 ， 其 输入 / 输出 都 是 按照 字符 流 的 方式 处 理 。 文 本 流 是 由 多 行 字 符 
构成 的 字符 序列 ， 而 每 行 字符 则 由 0 个 或 多 个 字符 组 成 ， 行 末 是 一 个 

换行 符 。 标 准 库 负责 使 每 个 输入 /输出 流 都 能 够 遵守 这 一 模 型 。 使 用 标 
准 库 的 C 语言 程序 员 不 必 关 心 在 程序 之 外 这 些 行 是 如 何 表示 的 。 

标准 库 提 供 了 一 次 读 / 写 一 个 字符 的 琅 数 ， 其 中 最 简单 的 古 getchar 和 


putchar 两 个 函数 。 每 次 调用 时 ， getchar 函数 从 文本 流 中 读 入 下 一 个 
输入 字符 ， 并 将 其 作为 结果 值 返 回 。 也 束 是 说 ， 在 执行 语句 


c = getchar() 


之 后 ， 变 量 c 中 将 包含 输入 流 中 的 下 一 个 字符 。 这 种 字符 通常 十 通过 
键盘 输入 的 。 关 于 从 文 件 输入 字符 的 方法 ， 我 们 将 在 第 7 章 中 讨论 。 


每 次 调用 putchar 函数 时 将 打印 一 个 字符 。 人 例如， 语句 
putchar() 


将 把 整 型 变量 c 的 内 容 以 字符 的 形式 打印 出 来 ， 通 常 是 显示 在 屏幕 
E ° putchar 与 printf 


PAS EBAY AE, CA Saal AP BL o 


1.5.1. 文件 复制 
借助 于 getchar 与 putchar 图 数 ， 可 以 在 不 了 解 其 它 输入 /输出 知识 的 情 


况 下 编写 出 数量 惊人 的 有 用 的 代码 。 最 简单 的 例子 束 是 把 输入 一 次 一 
个 字符 地 复制 到 输出 ， 其 基本 思想 如 下 : 


读 一 个 字符 
whi Le ( 该 字符 不 是 文件 结束 指示 符 ) 
输出 刚 读 入 的 字符 

读 下 一 个 字符 

将 上 述 基本 思想 转换 为 C 语言 程序 为 


#include <stdio.h> 


/* copy input to output; 1st version */ main() 
{ 

int c; 

c = getchar(); while (c != EOF) { 

putchar(c); 

c = getchar(); 

} 

} 


其 中 ， 关 系 运算 符 != 表 示 " 不 等 于 "。 FATE EER EE 
地 方 无 论 以 什么 形式 表现 ， 它 在 机 絮 内 部 都 是 以 位 模式 


存储 的 。char 类 型 专门 用 于 存储 这 种 字符 型 数据 ， 当 然 任何 整 型 (inb 
也 可 以 用 于 存储 字 


符 型 数据 。 因 为 某 些 潜在 的 重要 原因 ， 我 们 在 此 使 用 int 类 型 。 


这 里 需要 解决 如 何 区 分 文件 中 有 效 数 据 与 输入 结束 符 的 问题 。C 语言 
采取 的 解决 方法 是 : 在 没有 输入 时 ，getchar 函数 将 返回 一 个 特殊 值 ， 
这 个 特殊 值 与 任何 实际 字符 都 不 同 。 这 个 值 称 为 EOF(end of file, X 
件 结束 )。 我 们 在 声明 变量 c 的 时 候 ， 必 须 让 它 大 到 足以 存 放 getchar 
函数 返回 的 任何 值 。 这 里 之 所 以 不 把 c 声 明成 char 类 型 ， 是 因为 它 必 
须 足够 大 ， 除 了 能 存储 任何 可 能 的 字符 外 还 要 能 存储 文件 结束 符 
EOF ° 因此， 我 们 将 c 声明 成 int 类型。 

EOF 定义 在 头 文件 <stdio.h> 中 ， 是 个 整 型 数 ， 其 具体 数值 是 什么 并 不 
重要 ， 只 要 它 与 任何 char 类 型 的 值 都 不 相同 即 可 。 这 里 使 用 符号 党 
量 ， 可 以 确保 程序 不 需要 依赖 于 其 对 应 的 任何 特定 的 数值 。 


对 于 经 验 比较 丰富 的 C 语言 程序 员 ， 可 以 把 这 个 字符 复制 程序 编写 得 
更 精炼 一 些 。 在 C 


语言 中 ， 类 似 于 


c = getchar() 


ZARA ERE Fe — DREA, FFA RA—-ME, BUEME a Ace 
保存 的 值 。 也 束 是 说 ， 赋值 可 以 作为 更 大 的 表达 陈 的 一 部 分 出 现 。 如 
果 将 为 c 赋 值 的 操作 放 在 while 循环 语句 的 测 试 部 分 中 ， 上 述 字 符 复 
制程 序 便 可 以 改写 成 下 列 形式 : 


/* copy input to output; 2nd version */ main() 
{ 

int c; 

while ((c = getchar()) != EOF) putchar(c); 

} 


在 该 程序 中 ，while 循环 语句 首先 读 一 个 字符 并 将 其 赋值 给 c， 然 后 测 
斌 该 字符 是 否 为 文件 结束 标志 。 如 果 该 字符 不 是 文件 结束 标志 ， 则 执 
ÍT while 语句 体 ， 并 打印 该 字符 。 随 后 重复 执行 while 语句 。 当 到 达 
ees , while 循环 语句 终止 执行 ， 从 而 整个 main By 数 执 
行 结 ° 


以 上 这 段 程序 将 输入 集中 化 ，getchar 函数 在 程序 中 只 出 现 了 一 次 ， 这 
样 区 缩短 了 程序 ， 整个 程序 看 起 来 更 紧 煤 。 习 惯 这 种 风格 后 ， 读 者 就 
会 发 现 按 照 这 种 方式 编写 的 程序 更 易 阅 读 。 我 们 经 常会 看 到 这 种 风 

格 。( 不 过 ， 如 果 我 们 过 多 地 使 用 这 种 类 型 的 复杂 语句 ， 编 写 的 程序 可 
能 会 很 难 理解 ， 应 尽量 避免 这 种 情况 。) 

对 while 语句 的 条 件 部 分 来 说 ， 赋 值 表 达 式 两 边 的 圆 括号 不 能 省 略 。 

不 等 于 运算 符 != 的 TIC HOES EAC Re, EE, TEN 
使 用 圆 括 号 的 情况 下 关系 测试 != 将 在 赋值 = 操作 之 前 执行 。 因 此 语句 
c= getchar() != EOF 

等 价 于 语句 

c = (getchar() != EOF) 

该 语句 执行 后 ，c 的 值 将 被 置 为 0 或 1( 取 决 于 调用 getchar 函数 时 是 否 
页 到 文件 结束 标志 )， 这 并 不 是 我 们 所 希望 的 结果 (更 详细 的 内 容 ， 请 
参见 第 2 章 的 相关 部 分 )。 


练习 1。6 验证 表达 式 getchar() != EOF 的 值 是 0 还 是 1。 练习 
1°7 编写 一 个 打印 EOF 值 的 程序 。 


TiS: 字符 计数 
下 列 程序 用 于 对 字符 进行 计数 ， 它 与 上 面 的 复制 程序 类 似 。 


#include <stdio.h> 


/* count characters in input; 1st version */ main() 
{ 

long nc; 

nc = 0; 

while (getchar() != EOF) 

++nc; printf("%ld\n", nc); 

} 


其 中 ， 语 句 


++nc; 


引入 了 一 个 新 的 运算 符 ++， 其 功能 是 执行 加 1 操作。 可 以 用 语句 nc = 
nc+1 RRE, E 语句 ++nc 更 精炼 一 些 ， 且 通 肖 效率 也 更 高 。 与 该 运 
算 符 相应 的 是 目 减 运算 符 。。++ 与 这 两 个 运算 符 既 可 以 作为 前 级 运 
算 符 (如 ++nc)， 也 可 以 作为 后 级 运算 和 从 (如 nc++)。 我 们 在 第 2 章 中 
将 看 到 ， 这 两 种 形式 在 表达 式 中 具有 不 同 的 值 ， 但 ++nc 与 nc++ 都 使 
nc 的 值 增 加 1。 目前， 我 们 只 使 用 前 组 形式 。 


该 字符 计数 程序 使 用 long 类 型 的 变量 存放 计数 值 ， 而 没有 使 用 int 类 
型 的 变量 。long 整 型 数 (长 整 型 ) 至 少 要 占用 32 位 存储 单元 。 在 某 些 机 
右上 int 与 long 类 型 的 长 度 相 同 ， 但 在 一 些 机 器 上 ，int 类 型 的 值 可 能 
只 有 16 位 存储 单元 的 长 度 ( 最 大 值 为 32767)， 这 样 ， 相 当 小 的 输入 都 
可 能 使 int 类 型 的 计数 变量 淤 出 。 转 换 说 明 %1d 告诉 printf 函数 其 对 应 
的 参 数 是 long 整 型 。 

使 用 double( 双 精度 浮 点 数 ) 类 型 可 以 处 理 更 大 的 数字 。 我 们 在 这 里 不 
while 循 环 语句 ， 而 用 for 循环 语句 来 展示 编写 此 循环 的 另 一 种 

YE: 


#include <stdio.h> 


/* count characters in input; 2nd version */ main() 
{ 
double nc; 


for (nc = 0; gechar() != EOF; ++nc) 


printf("%.0f\n", nc); 
} 


对 于 float 与 double XÆ! © printf 函数 都 使 用 %f 进行 说 明 。%.0f 强制 
不 打印 小 数 点 和 小 数 部 分 ， 因 此 小 数 部 分 的 位 数 为 0。 


在 该 程序 段 中 ，for 循环 语句 的 循环 体 是 空 的 ， 这 是 因为 所 有 工作 都 在 
测试 (条 件 ) 部 分 与 增加 步 长 部 分 完成 了 。 但 C 语言 的 语法 规则 要 求 for 
循环 语句 必须 有 一 个 循环 体 ， 因 此 用 单独 的 分 号 代 蔡 。 单 独 的 分 号 称 
为 空 语句 ， 它 正好 能 满足 for 语句 的 这 一 要 求 。 把 它 单 独 放 在 一 行 是 
为 了 更 加 醒目 。 


在 结束 讨论 字符 计数 程序 之 前 ， 我 们 考虑 以 下 情况 :如 果 输 入 中 不 包含 
字符 ， 那 么 ,在 第 一 次 调用 getchar KAJE, while 语句 或 for 语 
句 中 的 条 件 测试 从 一 开始 吏 为 假 ， 程序 的 执行 结 采 将 为 0， 这 也 是 正 
确 的 结果 。 这 一 点 很 重要 。while 语句 与 for 语句 的 优点 之 一 就 是 在 
执行 循环 体 之 前 束 对 条 件 进行 测试 ， 如 采 条 件 不 满足 ， 则 不 执行 循环 
体 ， 这 束 可 能 出 现 循 环 体 一 次 都 不 执行 的 情况 。 在 出 现 0 长度 的 输入 
时 ， 程 序 的 处 理应 该 灵活 一 些 ， 在 出 现 边 界 条 件 时 ，while 语句 与 for 
语句 有 助 于 确保 程序 执行 合理 的 操作 © 


1.5.3. 行 计 数 
接 下 来 的 这 个 程序 用 于 统计 输入 中 的 行 数 。 我 们 在 上 面 提 到 过 ， 标 准 


库 保 证 输入 文本 流 以 行 序列 的 形式 出 现 ， 每 一 行 均 以 换行 符 结 束 。 因 
此 ， 统 计 行 数 等 价 于 统计 换行 符 的 个 数 。 


/* count lines in input */ main() 


{ 
int c, nl; 
nl = 0; 


while ((c = getchar()) != EOF) if (c == ^r’) 
++nl; printf("%d\n", nl); 
} 


在 该 程序 中 ，while MAN if eA), Exel Bia 
名 ++nl。 放 语句 先 测试 圆 括 号 中 的 条 件 ， 如 采 该 条 件 为 真 ， 则 执行 其 
后 的 语句 (或 括 在 花 括 号 中 的 一 组 语句 )。 这 里 再 次 用 缩 进 方式 表明 语 
句 之 间 的 控制 关系 。 


双 等 于 号 == 是 C 语言 中 表示 "等 于 "关系 的 运算 符 (类 似 于 Pascal 中 的 单 
等 于 号 = 及 Fortran 中 的 .EQ.)。 由 于 C 语言 将 单 等 于 号 = 作为 赋值 运算 
符 ， 因 此 使 用 双 等 于 号 == 表 示 相 等 的 逻辑 关系 ， 以 示 区 分 。 这 里 提醒 
注意 ， 在 表示 "等 于 "逻辑 关系 的 时 候 (应 该 用 ==)，C 语言 初学 者 有 时 
会 错误 地 写成 单 等 于 号 =。 在 第 2 章 我 们 将 看 到 ， 即 使 这 样 误 用 了 ， 
其 结 采 通常 仍然 是 合法 的 表达 式 ， 因 此 系统 不 会 给 出 警告 信息 。 


单 引 号 中 的 字符 表示 一 个 整 型 值 ， 该 值 等 于 此 字符 在 机 器 字符 集中 对 
应 的 数值 ， 我 们 称 之 为 字符 常量 。 但 是 ， 它 只 不 过 是 小 的 整 型 数 的 另 
一 种 写法 而 已 。 例 如 ，'A' 是 一 个 字符 常量 ; 在 ASCII 字符 集中 其 值 为 
65( 即 字符 A 的 内 部 表示 值 为 65)。 当 然 ， 用 'A' 要 比 用 65 好 ， 

为 。'A' 的 意义 更 清楚 ， 是 与 特定 的 字符 集 无 关 。 


字符 串 冲 量 中 使 用 的 转 义 字符 序列 也 是 合法 的 字符 前 量 ， 比 如 ，A 代 
表 换 行 符 的 值 ， 在 ASCI 字符 集中 其 值 为 10。 我 们 应 当 注 意 

到 ，' 十 单个 字符 ， 在 表达 式 中 它 不 过 是 一 个 整 型 数 而 已 ;而 "\n" 是 一 
个 仅 包含 一 个 字符 的 字符 串 冲 量 。 有 关 字 符 串 与 字符 之 间 的 关系 ， 我 
们 将 在 第 2 章 进一步 讨论 。 


练习 198 编写 一 个 统计 空格 、 制 表 符 与 换行 符 个 数 的 程序 。 


练习 1°9 编写 一 个 将 输入 复制 到 输出 的 程序 ， 并 将 其 中 连续 的 多 个 空 
格 用 一 个 空格 代替 。 

练习 1°10 编写 一 个 将 输入 复制 到 输出 的 程序 ， 并 将 其 中 的 制 表 符 替换 
为 t， 把 回 退 符 替换 为 b， 把 反 和 斜 杠 替 按 为 \。 这 样 可 以 将 制 表 符 和 回 
退 符 以 可 见 的 方式 显示 出 来 。 

1.5.4. 单词 计数 

我 们 将 介绍 的 第 4 个 实用 程序 用 于 统计 行 数 、 单 词 数 与 字符 数 。 这 里 
对 单词 的 定义 比较 宽松 ， 它 是 任何 其 中 不 包含 空格 、 制 表 符 或 换行 符 
的 字符 序列 。 下 面 这 段 程序 是 UNIX 系统 中 we 程序 的 骨干 部 分 : 


#include <stdio.h> 


#define IN 1 /* inside a word */ 


#define OUT 0 /* outside a word */ 


/* count lines, words, and characters in input */ main() 

{ 

int c, nl, nw, nc, state; 

state = OUT; 

nl =nw=nc=0; 

while ((c = getchar()) != EOF) { 

++nc; 

if (c == ^n’) 

++nl; 

if (c == '' || c=='\n' || c = ^t’) state = OUT; 

else if (state == OUT) { state = IN; 

++nw; 

} 

} 

printf("%d %d %d\n", nl, nw, nc); 

} 

程序 执行 时 ， 每 当 明 到 单词 的 第 一 个 字符 ， 它 束 作 为 一 个 新 单词 加 以 
统计 。state 变量 记录 程序 当前 钙 否 正 位 于 一 个 单词 之 中 ， 它 的 初 值 
是 "不 在 单词 中 "， 即 初 值 被 赋 为 OUT 。 我 们 在 这 里 使 用 了 符号 常量 
IN 与 OUT， 而 没有 使 用 其 对 应 的 数值 1 与 0， 这样 程 序 更 易 读 。 在 


较 小 的 程序 中 ， 这 种 做 法 也 许 看 不 出 有 什么 优势 ， 但 在 较 大 的 程序 
中 ， 如 有 果 从 一 开始 就 这 样 做 ， 因 此 而 增加 的 一 点 工作 量 与 提高 程序 可 


读 性 市 来 的 好 处 相 比 是 值得 的 。 读 者 也 会 发 更， 如果 程序 中 的 幻 数 都 
以 符号 常量 的 形式 出 现 ， 对 程序 进行 大 量 修 改 束 会 相对 容易 得 多 。 


下 列 语 句 


nl =nw=nc=0; 


将 把 其 中 的 3 个 变量 nl、nw 与 nc 都 设置 为 0。 这 种 用 法 很 销 见 ， 但 
要 注意 这 样 一 个 事实 : 在 兼 有 值 与 赋值 两 种 功能 的 表达 式 中 ， 赋 值 结合 
次 序 是 由 右 至 左 。 所 以 上 面 这 条 语句 等 同 于 


n1 = (nw = (nc = 0)); 
运算 符 || 代 表 OR( 逻 辑 或 )， 所 以 下 列 语句 
if (c == '' || c== ^n! || c == ^t’) 


的 意义 是 "如 果 c 是 空格 ， 或 c 是 换行 符 ， 或 c 是 制 表 符 "(前 面 讲 过 ， 

转 义 字符 序列 v 是 制 表 符 的 可 见 表示 形式 ) 。 相 应 地 ， 运 算 符 && 代 表 
AND( 涩 辑 与 )， 它 仅 比 | 高 一 个 优先 级 。 由 && 或 | 连接 的 表达 式 由 左 至 
右 求 值 ， 并 保证 在 求 值 过 程 中 只 要 能 够 淹 断 最 终 的 结果 为 真 或 假 ， 求 
什 就 立即 终止 。 如 果 c 是 空格 ， 则 没有 必要 再 测试 它 是 否 为 换行 答 或 
制 表 符 ， 这 样 就 不必 执行 后 面 两 个 测试 。 在 这 里 ， 这 一 点 并 不 特别 重 
要 ， 介 在 某 些 更 复杂 的 情况 下 这 样 做 就 有 必要 了 ， 不 久 我 们 将 会 看 到 
这 种 例子 。 


这 上 段 程序 中 还 包括 一 个 else 部 分 ， 它 指定 当主 语 句 中 的 条 件 部 分 为 假 
时 所 要 执行 的 动作 。 其 一 般 形式 为 : 


if (ÈIN) 


语句 1 


else 


语句 .2 


HH, ifselse 中 的 两 条 语句 有 且 仅 有 一 条 语句 被 执行 。 如 有 果 表 达 式 的 
值 为 真 ， 则 执行 语句 1， 否 则 执行 语句 2。 这 两 条 语句 都 既 可 以 是 单 
条 语句 ， 也 可 以 是 括 在 花 括 号 内 的 语句 序 列 。 在 单词 计数 程序 中 ， 

else 之 后 的 语句 仍 是 一 个 证 语句 ， 该 让 语句 控制 了 包含 在 花 括 号 内 的 


两 条 语句 。 


练习 1911 你 准备 如 何 测试 单词 计数 程序 ?如 条 程 序 中 存在 某 种 错误 ， 
那么 什么 样 的 输 入 最 可 能 发 现 这 类 错 旋 昵 ， 


练习 1.12 编写 一 个 程序 ， 以 每 行 一 个 单词 的 形式 打印 其 输入 。 
1.6 数组 
在 这 部 分 内 容 中 ， 我 们 来 编写 一 个 程序 ， 以 统计 各 个 数字 、 空 白 符 ( 包 


括 空 格 符 、 制 表 符 及 换行 符 ) 以 及 所 有 其 它 字符 出 现 的 次 数 。 这 个 程 
序 的 实用 如 义 并 个 和， 但 我 们 可 以 通过 WEP Ie C HE 2 22 TRIE 
题 。 


所 有 的 输入 字符 可 以 分 成 12 类 ， 因 此 可 以 用 一 个 数组 存放 各 个 数字 出 
现 的 次 数 ， 这 样 比 


使 用 10 个 独立 的 变量 更 方便 。 下 面 是 该 程序 的 一 种 版 本 : 


#include <stdio.h> 


/* count digits, white space, others */ main() 

{ 

int c, i, nwhite, nother; int ndigit[10]; 

nwhite = nother = 0; 

for (i = 0; i < 10; ++i) ndigit[i] = 0; 

while ((c = getchar()) != EOF) if (c >= '0' && c <= '9') 


++ndigit[ce'0']; 


else if (c =='' || c == ^\n' || c == \t") 

++nwhite; else 

++nother; 

printf("digits ="); 

for (i = 0; i < 10; ++i) printf(" %d", ndigit[i]); 

printf(", white space = %d, other = %d\n", nwhite, nother); 
} 

当 把 这 段 程序 本 吴 作 为 输入 时 ， 输 出 结果 为 : 

digits =9 300000001, white space = 123, other = 345 
该 程序 中 的 声明 语句 


int ndigit[10], 


将 变量 ndigit 声明 为 由 10 个 整 型 数 构成 的 数组 。 在 C 语言 


标 总 是 从 0 开始 ， 


， 数 组 下 


此 该 数组 的 10 个 元 素 分 别 为 ndigit[0]、ndiglt[1、、ndigit[9]， 这 可 以 
通过 初始 化 和 打印 数组 的 两 个 for 循环 语句 反映 出 来 。 


数组 下 标 可 以 是 任何 整 型 表达 式 ， 包 括 整 型 变量 (如 D 以 及 整 型 常量 。 
该 程序 的 执行 取决 于 数字 的 字符 表示 属性 。 例 如 ， 测 试 语句 


if (c >='0' && c <= '9') 


A ae c 中 的 字符 是 否 为 数字 。 如 采 它 是 数字 ， 那 么 该 数字 对 应 的 
又 AE 


只 有 当 '0、' 沾 、、'9' 具 有 连续 递增 的 值 时 ， 这 种 做 法 才 可 行 。 笠 运 的 
征 ， 所 有 的 字符 集 都 是 这 样 的 。 


由 定义 可 知 ，char 类 型 的 字符 是 小 整 型 ， 因 此 char 类 型 的 变量 和 篆 量 
在 算术 表达 式 中 等 价 于 int 类 型 的 变量 和 当量。 这 样 做 既 目 然 勾 方 
fE, 例如，c。…'0' 是 一 个 整 型 表达 式 ， 如 果 存 储 在 c 中 的 字符 

是 '0'@'9， 其 值 将 为 0 仿 9， 因 此 可 以 充当 数组 ndigit 的 合法 下 标 。 


判断 一 个 字符 是 数字 、 空 日 符 还 是 其 它 字 符 的 功能 可 以 由 下 列 语句 序 
列 完 成 : 


if (c >= '0' && c <= '9') 


++ndigit[ce'0']; 

else if (c == '' || c == An || c == ^t’) 
++nwhite; else 

++nother; 

程序 中 经 常 使 用 下 列 方式 表示 多 路 判定 : 


if (条 件 1) 


语句 1 
else if (条 件 1) 


VA] 2 


else 
语句 nm 


在 这 种 方式 中 ， 各 条 件 从 前 往 后 依次 求 值 ， 直 到 满足 某 个 条 件 ， 然 后 
执行 对 应 的 语句 部 分 。 这 部 分 语句 执行 完成 后 ， 整 个 语句 体 执行 结束 
(其 中 的 任何 语句 都 可 以 是 括 在 人 花 括 号 中 的 春 干 条 语句 )。 如 末 所 有 条 
件 都 不 满足 ， 则 执行 位 于 最 后 一 个 else 之 后 的 语句 (如 果 有 的 话 )。 类 
似 于 前 面 的 单词 计数 程序 ， 如 果 没有 最 后 一 个 else 及 对 应 的 语句 ， 该 
语句 体 将 不 执行 任何 动作 。 在 第 一 个 让 与 最 后 一 个 else 之 间 可 以 有 0 
个 或 多 个 下 列 形式 的 语句 序列 : 


else if (条 件 ) 

语句 

就 程序 设计 风格 而 言 ， 我 们 建议 读者 采用 上 面 所 示 的 缩 进 格式 以 体现 
该 结构 的 层次 关系 ， 否则 ， 如 采 每 个 证 都 比 前 一 个 else 同 里 缩 进 一 些 
距离 ， 那 么 较 长 的 判定 序列 就 可 能 超出 页 面 的 右边 界 。 

第 3 章 将 讨论 的 switch 语句 提供 了 编写 多 路 分 文 程序 的 另 一 种 方式 ， 
它 特别 适合 于 判 定 某 个 整 型 或 字符 表达 式 是 否 与 一 个 常量 集合 中 的 某 
个 元 素 相 匹配 的 情况 。 我 们 将 在 3.4 TE 


出 用 switch 语句 编写 的 该 程序 的 另 一 个 版 本 ， 与 此 进行 比较 。 


练习 1913 编写 一 个 程序 ， 打 印 输入 中 单词 长 度 的 直方 图 。 水 平方 同 的 
直方 图 比较 容易 绘制 ， 垂 直方 同 的 直方 图 则 要 困难 些 。 


1°14 编写 一 个 程序 ， 打 印 输入 中 各 个 字符 出 现 频 度 的 直方 


1.7 函数 


C 语言 中 的 函数 等 价 于 Fortran 语言 中 的 和 程序 或 函数 ， 也 等 价 于 

Pascal 语言 中 的 过 程 或 画 数 。 函 数 为 计算 的 封 流 提 供 了 一 种 简便 的 方 
法 ， 此 后 使 用 函数 时 不 需要 考虑 它 是 如 何 实 现 的 。 使 用 设计 正确 的 函 
数 ， 程 序 员 无 需 考 虑 功能 是 如 何 实现 的 ， 而 只 需 知 道 它 具有 哪些 功能 
WET ° FEC 语言 中 可 以 简单 、 方 便 、 融 效 地 使 用 芳 数 。 我 们 经 常会 
看 到 在 定义 后 仅 调用 了 一 次 的 短 丽 数 ， 这 样 做 可 以 使 代码 段 更 清晰 易 


到 目前 为 止 ， 我 们 所 使 用 的 函数 (如 printf、getchar 和 putchar 等 ) 都 是 
函数 库 中 提供 的 函数 。 现 在 ， 让 我 们 目 己 动手 来 编写 一 些 范 数 。C 语 
AKA Fortran 语言 一 样 提供 类 似 于 **# 的 求 军 运算 人 符 ， 我 们 现在 通 
过 编写 一 个 求 军 的 函数 power(m, n) 来 说 明 函 数 定 义 的 方法 。power(m, 
n) 芳 数 用 于 计算 整数 m 的 n 次 军 ， 其 中 nn 是正 整数 。 对 函数 调用 
power(2, 5) 来 说 ， 其 结果 值 为 32。 该 函数 并 非 一 个 实用 的 求 军 函 数 ， 
它 只 能 处 理 较 小 的 整数 的 正 整 数 次 军 ， 但 这 对 于 说 明 问 题 已 足够 了 。 
(标准 库 中 提供 了 一 个 计算 x* 的 函数 pow(x, y) ° ) 


下 面 是 函数 power(m, n) 的 定义 及 调用 它 的 主 程序 ， 这 样 我 们 可 以 看 到 
一 个 完整 的 程序 结构 。 


#include <stdio.h> 


int power(int m, int n); 
/* test power function */ main() 


{ 


int i; 

for (i = 0; i < 10; ++i) 

printf("%d %d %d\n", i, power(2,i), power(*3,i)); return 0; 
} 


/* power: raise base to neth power; n >= 0 */ int power(int base, int 


n) 

{ 

int i, p; 

p=1; 

for (i = 1; i<=n; ++i) p = p * base; 


return p; 


} 
函数 定义 的 一 般 形 式 为 : 
返回 值 类 型 画 数 名 (0 个 或 多 个 参数 声明 ) 


{ 
声明 部 分 
语句 序列 
} 


函数 定义 可 以 以 任意 次 序 出 现在 一 个 源 文件 或 多 个 源 文件 中 ， 但 同一 

函数 不 能 分 割 存放 在 多 个 文件 中 。 如 采 源 程序 分 散在 多 个 文件 中 ， 那 

么 ， 在 编译 和 加 载 时 ， 丈 需要 做 更 多 的 工作， 但 这 是 操作 系统 的 原 

， 并 不 是 语言 的 属性 决定 的 。 我 们 暂且 假定 将 main 和 power 这 两 

o 同一 文件 中 ， 这 样 前 面 所 学 的 有 关 运 行 C 语言 程序 的 知识 
ANAL © 


main 函数 在 下 列 语 句 中 调用 了 两 次 power 函数 : 

printf("%d %d %d\n", i, power(2, i), power(ei, 3)); 

每 次 调用 时 ，main 函数 向 power 函数 传递 两 个 参数 ;在 调用 执行 完成 
时 ，power Kt] main 函数 返回 一 个 格式 化 的 整数 并 打印 。 在 表达 式 
中 ，power(2, i)F] 2 和 i 一 样 都 是 整数 (并 不 是 所 有 函数 的 结果 都 是 整 
型 值 ， 我 们 将 在 第 4 章 中 讨论 )。 

power 函数 的 第 一 行 语 名 

int power(int base, int n) 


PHRMA > SFU RZ HRORABARNARA o power 函数 的 参 

数 使 用 的 名 字 只 在 power 函数 内 部 有 效 ， 对 其 它 任何 函数 都 是 不 可 见 
的 :其 它 函 数 可 以 使 用 与 之 相同 的 参数 名 字 而 不 会 引起 冲突 。 变 量 i 与 
p 也 是 这 样 :power EAA PAY i 与 main WA PAY i CK © 


我 们 通 第 把 函数 定义 中 圆 括号 内 列表 中 出 现 的 变量 称 为 形式 参数 ， 而 
把 函数 调用 中 与 形 式 参 数 对 应 的 值 称 为 实际 参数 。 


power 函数 计算 所 得 的 结果 通过 return 语句 返回 给 main 函数 。 关 键 字 
return 的 后 面 可 以 跟 任 何 表达 式 ， 形 式 为 : 


return WIA TN; 


EAN — ERA REME o A RIRES return 语句 将 把 控制 权 返 回 给 
WHE, (EAI HIE ° ASR TERA KAA AE S 
ET, Ea BIA TARA" o EKRE NA 略 函 数 返 回 的 值 。 


读者 可 能 已 经 注意 到 ，main 函数 的 末尾 有 一 个 retum 语句 。 由 于 main 
本 号 也 是 函数 ， 因 此 也 可 以 同 其 调用 者 返回 一 个 值 ， 该 调用 者 实际 上 
束 是 程序 的 执行 环境 。 一 般 来 说 ， 返 回 值 为 0 表示 正常 终止 ， 返 回 值 
为 非 0 表示 出 现 异 常情 况 或 出 错 结 束 条 件 。 为 简洁 起 见 ， 前 面 的 main 
函数 都 省 略 了 retum 语句 ， 但 我 们 将 在 以 后 的 main 函数 中 包含 return 

TA), 以 提醒 大 家 注意 ， 程 序 还 要 问 其 执行 环境 返回 状态 。 


出 现在 main 函数 之 前 的 声明 语句 


int power(int m, int n); 

表明 power 函数 有 两 个 int 类 型 的 参数 ， 并 返回 一 个 int 类 型 的 值 。 这 
种 声明 称 为 函数 原 型 ， 它 必须 与 power 函数 的 定义 和 用 法 一 致 。 如 果 
函数 的 定义 、 用 法 与 函数 原型 不 一 致 ， 将 出 现 错误 。 


KRUR E S KAE H RERNA DERAHE o EXE, KARERE 
数 名 是 可 选 的 ， 这 样 上 面 的 函数 原型 也 可 以 写成 以 下 形式 


int power(int, int); 


但 和 是， 合适 的 参数 名 能 够 起 到 很 好 的 说 明 性 作用 ， 因 此 我 们 在 函数 原 
型 中 总 是 指明 参数 名 。 


回顾 一 下 ，ANSI C 同 较 早 版 本 C 语言 之 间 的 最 大 区 别 在 于 函数 的 声 
明 与 定义 方式 的 不 同 。 按照 C 语言 的 最 初 定义 ，power 函数 应 该 写成 
FIJÉ: 

/* power: raise base to neth power; n >= 0 */ 

= (oldestyle version) */ power(base, n) 

int base, n; 

| 

int i, p; 

p=1; 

for (i = 1; i <= n; ++i) p = p * base; 

return p; 

} 

其 中 ， 参 数 名 在 圆 括号 内 指定 ， 参 数 类 型 在 左 花 括号 之 前 声明 。 如 果 
没有 声明 某 个 参数 的 类 A, MAAN int KE o KIES ANSI C 中 
形式 相同 。 


在 C 语言 的 最 初 定义 中 ， 可 以 在 程序 的 开头 按照 下 面 这 种 形式 声明 
power 函数 : 


int power(); 


RAPALA AERO, OTE ae ICIS EL 
power KOAH AEE. EKE, power 函数 在 默认 情况 下 将 被 假 


定 返回 int 类 型 的 值 ， 因 此 整个 函数 的 声明 可 以 全 部 省 略 。 


在 ANSI C 中 定义 的 函数 原型 语法 中 ， 编 译 套 可 以 很 容易 检测 出 函数 
调用 中 参数 数目 和 类 型 方面 的 错误 。ANSI C 仍然 文 持 旧式 的 函数 声 
明 与 定义 ， 这 样 至 少 可 以 有 一 个 过 流 阶 段 。 但 我 们 还 是 强烈 建议 读者 : 
在 使 用 新 式 的 编译 途 时 ， 最 好 使 用 新 式 的 钞 数 原型 声明 方式 。 


练习 1°15 重 狐 编写 1.2 市 中 的 温度 转换 程序 ， 使 用 函数 实现 瘟 
度 转换 计算 。 


1.8 参数 一 一 传 值 调用 


习惯 其 它 语言 (特别 是 Fortran 语言 ) 的 程序 员 可 能 会 对 C ER NKA 

数 传递 方式 感到 陌生 。 在 C 语言 中 ， 所 有 函数 参数 都 是 "通过 值 " 传 

递 的 。 也 就 是 说 ， 传 递 给 被 调用 函数 的 参数 值 存放 在 临时 变量 中 ， 而 

不 是 存放 在 原来 的 变量 中 。 这 与 其 它 某 些 语言 是 不 同 的 ， 比 如 ， 

Fortran 等 语言 是 "通过 引用 调用 "，Pascal 则 采用 var 参数 的 方式 ， 在 

aa 被 调用 的 函数 必须 访问 原始 参数 ， 而 不 是 访问 参数 的 本 
El) AX ° 


最 主要 的 区 别 在 于 ， 在 C 语言 中 ， 被 调用 函数 不 能 直接 修改 主 调 函 数 
中 变量 的 值 ， 而 只 能 修改 其 私有 的 临时 副本 的 值 。 


传 值 调用 的 利 大 于 弊 。 在 和 被 调用 函数 中 ， 参 数 可 以 看 作 是 便于 初始 化 
的 局 部 变量 ， 因 此 额外 使 用 的 变量 更 少 。 这 样 程序 可 以 更 紧 痰 简洁。 
侧 如 ， 下 面 的 这 个 power 函数 利用 了 这 一 性 质 : 


/* power: raise base to neth power; n >= 0; version 2 */ int 
power(int base, int n) 


{ 

int p; 

for (p = 1; n> 0; een) p = p * base; 

return p; 

} 

其 中 ， 参 数 n 用 作 临 时 变量 ， 并 通过 随后 执行 的 for 循环 语句 递减 ， 
直到 其 值 为 0， 这 样 束 不 需要 额外 引入 变量 ipower 函数 内 部 对 nm 的 
任何 操作 不 会 影响 到 调用 函数 中 的 原始 参 数值。 

必要 时 ， 也 可 以 让 函数 能 够 修改 主 调 函 数 中 的 变量 。 这 种 情况 下 ， 调 
用 者 需要 加 被 调用 函数 提供 待 设置 值 的 变量 的 地 址 (从 技术 角度 看 ， 
地 址 就 古 指 向 变量 的 指针 )， 而 被 调用 函数 则 需要 将 对 应 的 参数 声明 
为 指针 类 型 ， 并 通过 它 间 接 访 问 变量 。 我 们 将 在 第 5 章 中 讨论 指针 。 
如 有 宁 是 数组 参数 ， 情 况 就 有 所 不 同 了 。 当 把 数组 名 用 作 参 数 时 ， 传 递 
给 函数 的 值 是 数组 起 始 元 素 的 位 置 或 地 址 一 一 它 并 不 复制 数组 元 素 本 
村。 在 被 调用 函数 中 ， 可 以 通过 数组 下 标 访问 或 修改 数组 元 索 的 值 。 
这 是 下 一 节 将 要 讨论 的 问题 。 

1.9 字符 数组 

字符 数组 是 C 语言 中 最 常用 的 数组 类 型 。 下 面 我 们 通过 编写 一 个 程 
序 ， 来 说 明 字 符 数 组 以 及 操作 字符 数组 的 函数 的 用 法 。 该 程序 读 入 一 
组 文本 行 ， 并 把 最 长 的 文本 行 打印 出 来 。 该 算法 的 基本 框 、 非 常人 简单 : 
while (还 有 未 处 理 的 行 ) 

if (该 行 比 已 处 理 的 最 长 行 还 要 长 ) 


保存 该 行为 最 长 行 
保存 该 行 的 长 度 
打印 最 长 的 行 


从 上 面 的 框 、 中 很 容易 看 出 ， 程 序 很 目 然 地 分 成 了 铬 干 片 断 ， 分 别 用 
于 读 入 新 行 、 测 试 读 入 的 行 、 保 存 该 行 ， 其 余部 分 则 控制 这 一 过 程 。 


因为 这 种 划分 方式 比较 合理 ， 所 以 可 以 按照 这 种 方式 编写 程序 。 首 
先 ， 我 们 编写 一 个 独 立 的 函数 getline， 它 读 取 输入 的 下 一 行 。 我 们 尽 
量 你 持 该 画 数 在 其 它 场 台 也 有 用 。 人 至 少 getline 函数 应 该 在 读 到 文件 末 
尾 时 返回 一 个 信号 ;更 为 有 用 的 设计 是 它 能 够 在 读 入 文本 行 时 返回 该 行 
的 长 度 ， 而 在 遇 到 文件 结束 符 时 返回 0。 由 于 0 不 是 有 效 的 行 长 度 ， 
因此 可 以 作为 标志 文件 结束 的 返回 值 。 每 一 行 至 少 包 括 一 个 字符 ， 只 
包 舍 换行 符 的 行 ， 其 长 度 为 1。 

当 发 现 某 个 新 读 入 的 行 比 以 前 读 入 的 最 长 行 还 要 长 时 ， 融 需要 把 该 行 
保存 起 来 。 也 束 是 th, RR AA— TAM copy 把 新 行 复制 到 一 
个 安全 的 位 置 。 


最 后 ， 我 们 需要 在 主 函 数 main 中 控制 getline 和 copy 这 两 个 函数 。 以 
下 便 是 我 们 编 写 的 程序 : 


#include <stdio.h> 


#define MAXLINE 1000 /* maximum input line length */ 


int getline(char line[], int maxline); void copy(char to[], char from[]); 


/* print the longest input line */ main() 


{ 

int len; /* current line length */ 

int max; /* maximum length seen so far */ char 
line[MAXLINE]; /* current input line */ 


char longest[ MA XLINE]; /* longest line saved here */ 
max = 0; 
while ((len = getline(line, MAXLINE)) > 0) if (len > max) { 


max = len; copy(longest, line); 


} 

if (max > 0) /* there was a line */ printf("%s", longest); 

return 0; 

} 

/* getline: read a line into s, return length */ int getline(char 


s[],int lim) 

{ 

int c, i; 

for (i=0; i < limel && (c=getchar())!=EOF && c!='\n'; ++i) sli] = c; 
if (c == ^n’) { s[i] = c; 


++i; 


} 
sli] = '\0'; return i; 
} 


/* copy: copy ‘from’ into 'to'; assume to is big enough */ void 
copy(char to[], char from[]) 


{ 

int i; 

i = 0; 

while ((to[i] = from[i]) != ‘\0’) 
++i; 

} 


程序 的 开始 对 getline 和 copy 这 两 个 函数 进行 了 声明 ， 这 里 假定 它们 
都 存放 在 同一 个 文件 中 。 


main 与 getline 之 间 通 过 一 对 参数 及 一 个 返回 值 进 行 数据 交换 。 在 
getline KA, 两 个 参数 是 通过 程序 行 


int getline(char s[], int lim) 
声明 的 ， 它 把 第 一 个 参数 s 声明 为 数组 ， 把 第 二 个 参数 lim 声明 为 整 


型 ， 声 明 中 提供 数组 大 小 的 目的 是 留 出 存储 空间 。 在 getline 函数 中 没 
有 必要 指明 数组 s 的 长 度 ， 这 是 因为 该 数组 


的 大 小 是 在 main 函数 中 设置 的 。 如 同 power 函数 一 样 ，getline 函数 使 
用 了 一 个 return 语句 将 值 返回 给 其 调用 者 。 上 进程 序 行 也 声明 了 
getline 数 的 返回 值 类 型 为 int。 由 于 函数 的 默认 返回 值 类 型 为 int， 
此 这 里 的 int 可 以 省 略 。 


AL RRO AAA, mA EKRA copy) 仅 用 于 执行 一 些 动 作 ， 
并 不 返回 值 。copy 


函数 的 返回 值 类 型 为 void， 它 显 式 说 明 该 函数 不 返回 任何 值 。 

getline 函数 把 字符 \0'( 即 空 字符 ， 其 值 为 0) 插 入 到 它 创 建 的 数组 的 末 
尾 ， 以 标记 字符 串 的 结束 。 这 一 约定 已 被 C 语言 采用 : 当 在 C 语言 程 
序 中 出 现 类 似 于 

"hello\0" 


的 字符 串 常量 时 ， 它 将 以 字符 数组 的 形式 存储 ， 数 组 的 各 元 素 分 别 存 
储 子 符 串 的 各 个 字符 ， 并 以 \0' 标 志 了 字符 串 的 结 


hlie|llil|l1l1|lo |\n|\0 


printf 画 数 中 的 格式 规范 %s 规定 ， 对 应 的 参数 必须 是 以 这 种 形式 表示 
的 字符 种 。copy HS 的 实现 正 是 依赖 于 输入 参数 由 "0' 结 束 这 一 事 
实 ， 它 将 \0 特 由 到 输出 参数 中 。( 也 就 是 说 ， 空 字符 \0' 不 是 普通 文本 
的 一 部 分 。) 


值得 一 提 的 是 ， 即 使 是 上 述 这 样 很 小 的 程序 ， 在 传递 参数 时 也 会 过 到 
一 些 麻烦 的 设计 问题 。 例 如 ， 当 读 入 的 行 长 度 大 于 允许 的 最 大 值 时 ， 
main 函数 应 该 如 何 处 理 ，getline 函数 的 执行 是 安全 的 ， 无 论 是 否 到 达 
换行 符 字符 ， 当 数组 满 时 它 将 集 止 读 子 人行 。main 函数 可 以 通 过 测试 行 
的 长 度 以 及 检查 返回 的 最 后 一 个 字符 来 判定 当前 行 是 否 太 长 ， 然 后 再 
根据 具体 的 情 况 处 理 。 为 了 简化 程序 ， 我 们 在 这 里 不 考虑 这 个 问题 。 


调用 getline 函数 的 程序 无 法 预先 知道 输入 行 的 长 度 ， 因 此 getline 函数 
需要 检查 是 否 洲 出 。 男 一 方面 ， 调 用 copy 函数 的 程序 知道 (也 可 以 找 
出 ) 字 符 串 的 长 度 ， 因 此 该 贸 数 不 需要 进行 错误 检查 。 


练习 1916 修改 打印 最 长 文本 行 的 程序 的 主 程序 main， 使 之 可 以 打印 
任意 长 度 的 输入 行 的 长 度 ， 并 尽 可 能 多 地 打印 文本 。 


练习 117 ”编写 一 个 程序 ， 打 印 长 度 大 于 80 个 字符 的 所 有 输入 
行 。 


练习 1918 编写 一 个 程序 ， 删 除 每 个 输入 行 末 尾 的 空格 及 制 表 符 ， 并 删 


除 完 全 是 空格 的 行 。 


练习 1°19 Fn Fj KZN reverse(s)， 将 字符 串 s PAU Fr lly UBER ° 18 
用 该 函数 编写 一 个 程序 ， 每 次 颠倒 一 个 输入 行 中 的 字符 顺序 。 


1.10 外 部 变量 与 作用 域 


main 函数 中 的 变量 (如 line ` longest 等 ) 是 main 函数 的 私 目 变量 或 局 部 
变量 。 由 于 它们 是 在 main 函数 中 声明 的 ， 因 此 其 它 函 数 不 能 直接 访 

问 它 们 。 其 它 函 数 中 声明 的 变量 也 同样 如 此 。 例 如 ，getline 函数 中 声 
明 的 变量 i copy 函数 中 声明 的 变量 i 没有 关系 。 画 数 中 的 每 个 局 部 
变量 只 在 芳 数 被 调用 时 存在 ， 在 玉 数 执行 完毕 退出 时 消失 。 这 也 是 其 


BIE 


Ol 


通常 把 这 类 变量 称 为 目 动 变 最 的 原因 。 以 后 我 们 使 用 " 目 动 变量 " 代 
表 " 局 部 变量 "。( 第 4 


意 将 讨论 static 存储 类 ， 这 种 类 型 的 局 部 变量 在 多 次 画 数 调用 之 间 保 
持 值 不 变 。) 


由 于 目 动 变量 只 在 函数 调用 执行 期 间 存在 ， 因 此 ， 在 函数 的 两 次 调用 
之 间 ， 目 动 变量 不 保留 前 次 调用 时 的 赋值 ， 且 在 每 次 进入 函数 时 都 要 
显 式 为 其 赋值 。 如 果 目 动 变 量 没有 赋值 ， 则 其 中 存放 的 是 无 效 值 。 


除 目 动 变 量 外 ， 还 可 以 定义 位 于 所 有 函数 外 部 的 变量 ， 也 就 是 说 ， 在 
所 有 函数 中 都 可 以 通过 变量 名 访问 这 种 类 型 的 变量 (这 机 制 同 Fortran 
语言 中 的 COMMON 变量 或 Pascal 语言 中 最 外 层 程序 块 声明 的 变量 非 
常 类 似 )。 由 于 外 部 变量 可 以 在 全 局 范围 内 访问 ， 因 此 ， 画 数 间 可 以 
通过 外 部 变量 交换 数据 ， 而 不 必 使 用 参数 表 。 再 者 ， 外 部 变量 在 程序 
执行 期 间 一 直 存 在 ， 而 不 是 在 图 数 调用 时 产生 、 在 函数 执行 完毕 时 消 
这 些 变量 仍 将 保持 原来 的 
NOD o 


外 部 变量 必须 定义 在 所 有 函数 之 外 ， 且 只 能 定义 一 次 ， 定 义 后 编译 程 
序 将 为 它 分 配 存 储 单元 。 在 每 个 需要 访问 外 部 变量 的 函数 中 ， 必 须 声 
明 相 应 的 外 部 变量 ， 此 时 说 明 其 类 型 。 声 明 时 可 以 用 extern 语句 显 式 
声明 ， 也 可 以 通过 上 下 文 隐 式 声明 。 为 了 更 详细 地 讨论 外 部 变 量 ， 我 
们 改写 上 述 打 印 最 长 文本 行 的 程序 ， 把 line ` longest 与 max 声明 成 外 
部 变量 。 这 需要 修改 这 3 个 函数 的 调用 、 声 明 与 函数 体 。 


int getline(void); void copy(void); 

/* print longest input line; specialized version */ main() 
{ 

int len; 

extern int max; 


extern char longest[]; 


max = 0; 

while ((len = getline()) > 0) if (len > max) { 

max = len; copy(); 

} 

if (max > 0) /* there was a line */ printf("%s", longest); 
return 0; 

} 

/* getline: specialized version */ int getline(void) 
{ 

int c, i; 

extern char line[ ]; 

for (i = 0; i < MAXLINE « 1 

&& (c=getchar)) != EOF && c != '\n'; ++i) line[i] = c; 

if (c == ^n) { line[i] = c; 

++i; 


} 


line[i] = ^\0'; return i; 

} 

/* copy: specialized version */ void copy(void) 

{ 

int i; 

extern char line[], longest[]; 

i=0; 

while ((longest[i] = line[i]) != ^0) 

++i; 

} 

在 该 例子 中 ， BI JLÍTÆX T main ` getline 与 copy 函数 使 用 的 几 个 外 
部 变量 ， 声 明 了 各 外 部 变量 的 类 型 ， 这 样 编译 程序 将 为 它们 分 配 存储 
单元 。 从 语法 角度 看 ， 外 部 变量 的 定 义 与 局 部 变量 的 定义 是 相同 的 ， 
但 由 于 它们 位 于 各 画 数 的 外 部 ， 因 此 这 些 变 量 是 外 部 变量 。 夯 数 在 使 
用 外 部 变量 之 前 ， 必 须要 知道 外 部 变量 的 名 字 。 要 达到 该 目的 ， 一 种 
方式 是 在 函数 中 使 用 extern 类 型 的 声明 。 这 种 类 型 的 声明 除了 在 前 面 
加 了 一 个 天 键 字 exten 外 ， 其 它 方面 与 普通 变量 的 声明 相同 。 


某 些 情况 下 可 以 省 略 extern 声明 。 在 源 文件 中 ， 如 采 外 部 变量 的 定义 
出 现在 使 用 它 的 函数 之 前 ， 那 么 在 那个 函数 中 束 没 有 必要 使 用 extern 
HH o KK, main ` getline 及 copy 中 的 几 个 extern 声明 都 是 多 余 的 。 
在 通常 的 做 法 中 ， 所 有 外 部 变量 的 定义 都 放 在 源 文件 的 开始 处 ， 这 样 
WL AY LAA AS extern 声明 。 


如 果 程 序 包含 在 多 个 源 文件 中 ， 而 某 个 变量 在 filel 文件 中 定义 、 在 
file2 和 file3 文件 中 使 用 ， 那 么 在 文件 fie2 5 filed 中 天 需要 使 用 
extern 声明 来 建立 该 变量 与 其 定 义 之 间 的 联系 。 人 们 通常 把 变量 和 函 
数 的 extern 声明 放 在 一 个 单独 的 文件 中 (习惯 上 称 之 为 头 文 件 )， 并 在 


每 个 源 文 件 的 开头 使 用 #include 语句 把 所 要 用 的 头 文件 包含 进来 。 后 
级 名 .h 约定 为 头 文 件 名 的 扩展 名 。 例 如 ， 标 准 库 中 的 函数 吏 是 在 类 似 
于 <stdio.h> 的 头 文件 中 声明 的 。 更 详细 的 信息 将 在 第 4 草 中 讨论 ， 第 
7 革 及 附录 B 将 讨论 函数 库 。 


在 上 述 特别 版 本 中 ， 由 于 getline 与 copy HAAN, ANG 
辑 上 讲 ， 在 源 文 件 开始 处 它们 的 原型 应 该 是 getline0 5 copy() ° 但 为 
了 与 老 版 本 的 C 语言 程序 兼容 ，ANSI C 语言 把 空 参数 表 看 成 老 版 本 
C 语言 的 声明 方式 ， 并 且 对 参数 表 不 再 进行 任何 检查 。 在 ANSI C 
中 ， 如 果 要 声明 衬 参 数 表 ， 则 必须 使 用 关键 字 void 进行 显 式 声明 。 第 
4 章 将 对 此 进一步 讨论 。 


读者 应 该 注意 到 ， 这 市 中 我 们 在 谈论 外 部 变量 时 谨慎 地 使 用 了 定义 
(define) 与 声明 (declaration) 这 两 个 词 。" 定 义 " 表 示 创 建 变 量 或 分 配 存储 
单元 ， 而 "声明 " 指 的 是 说 明 变 量 的 性 质 ， 但 并 不 分 配 存 储 单 元 。 


顺便 提 一 下 ， 现 在 越 来 越 多 的 人 把 用 到 的 所 有 东西 都 作为 外 部 变量 使 
用 ， 因 为 似乎 这 样 可 以 位 化 数据 的 通信 一 一 参数 表 变 短 了 ， 上 且 在 需要 
时 总 可 以 访问 这 些 变量 。 但 是 ， 即 使 在 不 使 用 外 部 变量 的 时 候 ， 它 们 
也 是 存在 的 。 过 分 依赖 外 部 变量 会 导致 一 定 的 风险 ， 因 为 它 会 使 程序 
中 的 数据 关系 模糊 不 清 一 一 外 部 变量 的 值 可 能 会 被 意外 地 或 不 经 意 地 
修改 ， 而 程序 的 修 改 又 变 得 十 分 困难 。 我 们 前 面 编写 的 打印 最 长 文本 
行 的 程序 的 第 2 SARA AUER 1 个 版 本 


好 ,原因 有 两 方面 ， 其 一 便 是 使 用 了 外 部 变量 ; 男 一 方面 ， 第 2 个 版 本 
中 的 函数 将 它们 所 操纵 的 变量 名 直接 写 入 了 函数 ， 从 而 使 这 两 个 有 用 
的 函数 失去 了 通用 性 。 


到 目前 为 止 ， 我 们 已 经 对 C 语言 的 传统 核心 部 分 进行 了 介绍 。 借 助 于 
这 些 少量 的 语言 元 系 ， 我 们 已 经 能 够 编写 出 相当 规模 的 有 用 的 程序 。 
建议 读者 伦 一 些 时 间 编 写 程序 作为 练习 。 下 面 的 儿 个 练习 比 本 章 前 面 
编写 的 程序 要 复杂 一 些 。 


练习 1°20 编写 程序 detab， 将 输入 中 的 制 表 符 蔡 换 成 适当 数目 的 空 
格 ， 使 空格 充满 到 下 一 个 制 表 符 终 止 位 的 地 方 。 假 设 制 表 符 终 止 位 的 
EEREN, EER n 列 就 会 出 现 一 个 制 表 符 终 止 位 。n 应 该 作 


E Avy O, A5 E, 


AAS BETS Is BE? 


练习 1°21 编写 程序 entab, HEAR ER RN Be RCRA rill Ze FF A AS 
格 ， 但 要 保持 单词 之 间 的 间隔 不 变 。 假 设 制 表 符 终止 位 的 位 置 与 练习 
1°20 的 detab 程序 的 情况 相同 。 当 使 用 一 个 制 表 符 或 者 一 个 空格 都 可 
以 到 达 下 一 个 制 表 符 终 止 位 时 ， 选 用 哪 一 种 蔡 换 字符 比较 好 ? 


练习 1.22 编写 一 个 程序 ， 把 较 长 的 输入 行 " 折 " 成 短 一 些 的 两 行 或 多 
行 ， 折 行 的 位 置 在 输入 行 的 第 n 列 之 前 的 最 后 一 个 非 空格 之 后 。 要 保 
SE BEEBEE A TRK EE TATE NM 
符 时 的 情况 。 


练习 1°23 编写 一 个 删除 C 语言 程序 中 所 有 的 注释 语句 。 要 正确 处 理 市 
引号 的 字符 串 与 字符 常量 。 在 C 语言 中 ， 注 释 不 允许 艇 套 。 


练习 1024 编写 一 个 程序 ， 查 找 C 语言 程序 中 的 基本 语法 错误 ， 如 圆 括 
5S ATS > 16 括号 不 配对 等 。 要 正确 处 理 引 号 (包括 单 引 二 和 双 引 
号 )、 转 义 字 符 序 列 与 注释 。( 如 采 读 者 想 把 该 程序 编写 成 完全 通用 的 
程序 ， 难 度 会 比较 大 。) 


第 2 章 类 型 、 运 算 符 与 表达 式 


变量 和 第 量 是 程序 处 理 的 两 种 基本 数据 对 象 。 声 明 语句 说 明 变 量 的 名 
字 及 类 型 ， 也 可 以 指定 变量 的 初 值 。 运 算 符 指定 将 要 进行 的 操作 。 表 
达 式 则 把 变量 与 彰 量 组 合 起 来 生成 新 的 值 。 对 象 的 类 型 决定 该 对 象 可 
取 值 的 集合 以 及 可 以 对 该 对 象 执行 的 操作 。 本 章 将 评 细 讲述 这 些 内 


(m) 


ANSI 标 准 对 语言 的 基本 类 型 与 表达 式 做 了 许多 小 的 修改 与 增 

补 。 所 有 整 型 都 包括 signed( 带 符号 ) 和 unsigned( 无 符号 ) 两 种 形式 ， 

且 可 以 表示 无 符号 常量 与 十 六 进 制 字 符 常 量 。 浮 点 运算 可 以 以 单 精度 
进行 ， 还 可 以 使 用 更 高 精度 的 long double 类 型 运算 。 字 符 串 常量 可 以 
在 编译 时 连接 。ANSI C 还 文 持 枚 举 类 型 ， 该 语言 特性 经 过 了 长 期 的 发 
展 才 形成 。 对 象 可 以 声明 为 ”const( 常 量 ) 类 型 ， 表 明 其 值 不 能 修改 。 
该 标准 还 对 算术 类 型 之 间 的 目 动 强制 转换 规则 进行 了 扩充 ， 以 适合 

更 多 的 数据 类 型 。 


2.1 变量 名 


对 变量 的 命名 与 符号 常量 的 命名 存在 一 些 限制 条 件 ， 这 一 点 我 们 在 第 
1 草 没有 说 明 。 名 字 是 由 字母 和 数 子 组 成 的 序列 ， 但 其 第 一 个 字符 必 
须 为 字母 。 下 划 线 “_" 被 看 做 是 字母 ， 通 常用 于 命名 较 长 的 变量 名 ， 
以 提高 其 可 读 性 。 由 于 例 程 的 名 字 通 第 以 下 划 线 开头 ， 因 此 变量 名 不 
要 以 下 划 线 开 涉 。 大 写字 母 与 小 写字 和 母 是 有 区 别 的 ， 所 以 ,x 与 X 是 
两 个 不 同 的 名 字 。 在 传统 的 C 语言 用 法 中 ， 变 量 名 使 用 小 写字 和 母 ， 符 
号 角 量 名 全 部 使 用 大 写字 母 。 


对 于 内 部 名 而 言 ， 至 少 前 31 个 字符 是 有 效 的 。 函 数 名 与 外 部 变量 名 包 
含 的 字符 数目 可 能 小 于 31， 这 是 因为 汇编 程序 和 加 载 程 序 可 能 会 使 用 
这 些 外 部 名 ， 而 语言 本 身 是 无 法 控制 加 载 和 汇编 程序 的 。 对 于 外 部 
Z, ANSI 标准 仅 保证 前 6 个 字符 的 惟一 性 ， 并 且 不 区 分 大 小 写 。 类 
ILF if ` else ` int ` float 等 关键 字 是 保留 给 语言 本 身 使 用 的 ， 不 能 把 
它们 用 做 变量 名 。 所 有 关 健 字 中 的 字符 都 必须 小 写 。 


选择 的 变量 名 要 能 够 尽量 从 字面 上 表达 变量 的 有 用途， 这样 做 不 容易 引 
起 混淆 。 局 部 变量 一 般 使 用 较 短 的 变量 名 (尤其 是 循环 控制 变量 )， 外 


部 变量 使 用 较 长 的 名 字 。 
2.2 数据 类 型 及 长 度 


C 语言 只 提供 了 下 列 儿 种 基本 数据 类 型 : 


char 字符 型 ， 占 用 一 个 字 节 ， 可 以 存放 本 地 字符 集中 的 一 个 字 
符 

int 整 型 ， 通 第 反映 了 所 用 机 器 中 整数 的 最 目 然 长 度 

float 单 精度 浮 点 型 

double 双 精 度 浮 点 型 


此 外 ， 还 可 以 在 这 些 基本 数据 类 型 的 前 面 加 上 一 些 限定 符 。short 5 
long 两 个 限定 符 用 于 限定 整 型 


short int sh; 


long int counter; 


在 上 述 这 种 类 型 的 声明 中 ， 关 键 字 int AA o HAR At) 
这 人 么 做 。 


short 与 long 两 个 限定 符 的 引入 可 以 为 我 们 提供 满足 实际 需要 的 不 同 长 
度 的 整 型 数 。 int 通常 代表 特定 机 器 中 整数 的 目 然 长 度 。short 类 型 通 
常 为 16 位 ，1long 类 型 通常 为 32 位 ，int 类 型 可 以 为 16 位 或 32 位。 
各 编译 癸 可 以 根据 硬件 特性 自主 选择 合适 的 类 型 长 度 ， 但 要 遵循 下 列 
限制 :short 与 int 类 型 至 少 为 16 位 ， 而 long 类 型 至 少 为 32 W, FA 
short 类 型 不 得 长 于 int 类 型 ， 而 int 类 型 不 得 长 于 long 类 型 。 


类 型 限定 和 从 signed 与 unsigned 可 用 于 限定 char 类 型 或 任何 整 型 。 
unsigned 类 型 的 数 总 是 正 值 或 0， 并 遵守 算术 模 2' 定 律 ， 其 中 n 是 该 
类 型 占用 的 位 数 。 例 如 ， 如 果 char 对 象 占 用 8 位， 那么 unsigned char 
类 型 变量 的 取 值 范围 为 0@@255， 而 signed char 类 型 变量 的 取 值 范围 
则 为 .128 象 127( 在 采用 对 二 的 补 码 的 机 器 上 )。 不 带 限 定 符 的 char 类 型 
WR 是 否 带 符号 则 取决 于 具体 机 器 ， 但 可 打印 字符 总 是 正 值 。 


long double 类 型 表示 高 精度 的 浮 点 数 。 同 整 型 一 样 ， 浮 点 型 的 长 度 也 
取决 于 具体 的 实 现 。float、double 与 long double 类 型 可 以 表示 相同 的 
长 度 ， 也 可 以 表示 两 种 或 三 种 不 同 的 长 度 。 


有 关 这 些 类 型 长 度 定义 的 符号 常量 以 及 其 它 与 机 絮 和 编译 器 有 关 的 属 
性 可 以 三 标准 头 广 件 <limits.h> 与 <float.h> 中 找到 ， 这 些 内 容 将 在 附录 
B 中 讨论 。 


练习 201 编写 一 个 程序 以 确定 分 别 由 signed 及 unsigned 限定 的 char、 

short ` int 与 long 类 型 变量 的 取 值 范围 。 采 用 打印 标准 头 文 件 中 的 相 

应 值 以 及 直接 计算 两 种 方式 实 现 。 后 一 种 方法 的 实现 较 困 难 一 些 ， 
为 要 确定 各 种 浮 点 类 型 的 取 值 范 围 。 


2.3 常量 


类 似 于 1234 的 整数 常量 属于 int 类 型 。long 类 型 的 常量 以 字母 1 或 工 
结尾 ， 如 123456789L。 如 果 一 个 整数 太 大 以 至 于 无 法 用 int 类 型 表示 


Eg 


时 , 也 将 被 当 作 long 类 型 处 理 ° 无 符号 常量 以 字母 u BY U 结 Æ ° 后 
23 ul BY UL 表明 是 unsigned long 类 型 。 


浮 点 数 帅 量 中 包含 一 个 小 数 点 (如 123.4) 或 一 个 指数 (如 le*2)， 也 可 以 
两 者 都 有 。 ARNE ASH BY double 类 型 。 后 级 或 F 表示 
float 类 型 ， 而 后 级 1 或 L 则 表示 long double 类 型 。 


整 型 数 除 了 用 十 进 制 表示 外 ， 还 可 以 用 八进制 或 十 六 进 制 表示 。 带 前 
级 0 的 整 型 常量 表示 它 为 八进制 形式 ;前 级 为 0x 或 0X， 则 表示 它 为 十 
六 进 制 形式 。 例 如 ， 十 进 制 数 31 可 以 写 成 八进制 形式 037， 也 可 以 写 
成 十 六 进 制 形式 0x1f 或 0X1F。 八 进 制 与 十 六 进 制 的 常量 也 可 以 使 用 
后 级 LL 表示 long 类 型 ， 使 用 后 级 U 表示 unsigned 类 型 。 例 如 ， 

OXFUL 是 一 个 unsigned long 类 型 (无 从 号 长 整 型 ) 的 常量 ， 其 值 等 于 十 
进 制 数 15。 


一 个 字符 彰 量 是 一 个 整数 ， 书 写 时 将 一 个 字符 括 在 单 引 豆 中 ， 
WW, ‘xo HAE ET 集中 的 数值 殉 是 字符 向 量 的 值 。 例 如 ， 在 
ASCII 字符 集中 ， 字 符 '0 的 值 为 48， 它 与 数值 0 没有 关系 。 如 果 用 字 
符 '0' 代 兰 这 个 与 具体 字符 集 有 关 的 值 (比如 48)， 那 么 ， 程 序 束 无 需 关 
心 该 字符 对 应 的 具体 值 ， 增 加 了 程序 的 易 读 性 。 字 符 浓 量 一 般 用 来 与 
其 它 字符 进行 比较 ， 但 也 可 以 像 其 它 整数 一 样 参与 数值 运算 ， 


某 些 字 符 可 以 通过 园 义 字符 序列 (例如 ， 换 行 符 由 表示 为 字符 和 字符 串 
常量 。 转 义 字 符 序 列 看 起 来 像 两 个 字符 ， 但 只 表示 一 个 字符 。 男 外 ， 
我 们 可 以 用 


\000' 


表示 任意 的 字 节 大 小 的 位 模式 。 其 中 ，ooo 代表 103 个 八进制 数字 
(0...7)。 这 种 位 模式 还 可 以 用 


‘\xhh' 


表示 ， 其 中 ，hh 是 一 个 或 多 个 十 六 进 制 数字 (0...9, a...f，A...F)。 
此 ， 我 们 可 以 按照 下 列 形式 书写 语句 : 


#define VTAB '\013' /* ASCII vertical tab */ 

#define BELL '\007' /* ASCII bell character */ 

上 述 语句 也 可 以 用 十 六 进 制 的 形式 书写 为 : 

#define VTAB \xb' /* ASCII vertical tab */ 

#define BELL \x7' /* ASCII bell character */ ANSI C 语言 中 的 全 
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彰 量 表达 式 是 仅仅 只 包含 常量 的 表达 式 。 这 种 表达 式 在 编译 时 求 值 ， 
而 不 在 运行 时 求 值 。 它 可 以 出 现在 常量 可 以 出 现 的 任何 位 置 ， 例 如 : 


#define MAXLINE 1000 char line[ MAXLINE+1]; 
或 


#define LEAP 1 /* in leap years */ 


int days[31+28+LEAP+31+30+31+30+31+31+30+31+30+31]; 


字符 串 常量 也 叫 学 符 串 字面 值 ， 是 用 双 引 号 括 起 来 的 0 个 或 多 个 字符 
组 成 的 字符 序列 。 例 如 : 


"Tam a string" 
a 
[* ZS PRE ER #/ 


符 串 。 双 引号 不 是 字符 串 的 一 部 分 ， 它 只 用 于 限定 字符 串 。 字 
中 使 用 的 转 义 字 符 序 列 同样 也 可 以 用 在 字符 串 中 。 在 字符 串 中 


TEN 


» 


符 常 


使 用 \" 表 示 双 引号 字符 。 编 译 时 可 以 将 多 个 字 符 串 常量 连接 起 来 ， 例 
如 ， 下 列 形式 : 


"hello," " world" 


等 价 于 
"hello, world" 


TITRE BE AEE APIA FE EB PE a SCAT be T 
文 持 。 从 技术 角度 看 ， 字 符 串 常量 就 是 字符 数组 。 字 符 串 的 内 部 表示 
使 用 一 个 空 字 符 \0' 作 为 


串 的 结尾 ， 因 此 。 存 储 字符 串 的 物理 存储 单元 数 比 括 在 双 引 号 中 的 字 
符 数 多 一 个 。 这 种 表示 


方法 也 说 明 ，C 语言 对 字符 串 的 长 度 没有 限制 ， 但 程序 必须 扫 摘 完整 
个 字符 串 后 才能 确定 字符 串 的 长 度 。 标 准 库 函 数 strlen(s) 可 以 返回 字 
符 串 参数 s 的 长 度 ， 但 长 度 不 包括 末尾 的 \0'。 下 面 是 我 们 设计 的 
strlen 函数 的 一 个 版 本 : 


/* strlen: return length of s */ int strlen(char s[]) 
{ 

int i; 

while (s[i] != ^0) 

++i; 

return 1; 

} 


标准 头 文件 <string h> 中 声明 了 strlen ALL EE PA 。 我 们 应 该 搞 
清楚 字符 常量 与 仅 包含 一 个 字符 的 字符 串 之 间 的 区 别 :x' 与 "x" 是 不 同 


前 者 是 一 个 整数 ， 其 值 是 字母 在 机 融 字 符 集中 对 应 的 数值 (内 部 表示 
值 ); 后 者 是 一 个 包含 


一 个 字符 ( 即 字母 习 以 及 一 个 结束 符 \0' 的 字符 数组 。 


>F 
A 渤 


SE He Fah RA A oo M EREI, A 


enum boolean { NO, YES }; 


在 没有 显 式 说 明 的 情况 下 ，enum 类 型 中 第 一 个 枚 举 名 的 值 为 0， 第 二 
个 为 1， 依 此 类 推 。 如 果 只 指定 了 部 分 枚 举 名 的 值 ， 那 么 未 指定 值 的 
a a 参看 下 面 两 个 例子 中 的 
第 二 个 例子 


enum escapes { BELL = \a', BACKSPACE = \b, TAB = \t, NEWLINE = 
‘\n', VTAB = \v, RETURN = \r' }; 


enum months { JAN = 1, FEB, MAR, APR, MAY, JUN, JUL, AUG, SEP, 
OCT, NOV, DEC }; 


/* FEB 的 值 为 2，MAR 的 值 为 3， 依 此 类 推 */ 

不 同 枚 举 中 的 名 字 必 须 互 不 相同 。 同 一 枚 举 中 不 同 的 名 字 可 以 具有 相 
同 的 值 。 枚 举 为 建立 常量 值 与 名 字 之 间 的 关联 提供 了 一 种 便利 的 方 
式 。 相 对 于 #define 语句 来 说 ， 


它 的 优势 在 于 常量 值 可 以 目 动 生 成 。 尽 管 可 以 声明 enum 类 型 的 变 
量 ， 但 编译 万 不 检查 这 种 类 


型 的 变量 中 存储 的 值 是 否 为 该 枚 举 的 有 效 值 。 不 过 ， 枚 举 变量 提供 这 
种 检查 ， 因 此 枚 举 比 


人 


2.4 声明 


所 有 变量 都 必须 先 声明 后 使 用 ， 尽 管 某 些 变量 可 以 通过 上 下 文 隐 式 地 
声明 。 一 个 声明 指 定 一 种 变量 类 型 ， 后 面 所 带 的 变量 表 可 以 包含 一 个 
或 多 个 该 类 型 的 变量 。 例 如 : 


int lower, upper, step; char c, 1ine[1000]; 


一 个 声明 语句 中 的 多 个 变量 可 以 拆 开 在 多 个 声明 语句 中 声明 。 上 面 的 
两 个 声明 语句 也 可 以 等 价 地 写成 下 列 形式 : 


int lower; int upper; int step; char c; 
cbar line[1000]; 


按照 这 种 形式 书写 代码 需要 占用 较 多 的 空间 ， 但 便于 癌 各 声明 语句 中 
添加 注释 ， 也 便于 以 后 修改 。 


还 可 以 在 声明 的 同时 对 变量 进行 初始 化 。 在 声明 中 ， 如 果 变 量 名 的 后 
面 紧 跟 一 个 等 号 以 及 一 个 表达 式 ， 该 表达 式 就 充当 对 变量 进行 初始 化 
的 初始 化 表达 式 。 例 如 : 


char esc = '\\'; int i = 0; 
int limit = MAXLINE + 1; float eps = 1.0e¢5; 


如 果 变 量 不 是 自动 变量 ， 则 只 能 进行 一 次 初始 化 操作 ， 从 概念 上 讲 ， 
应 该 是 在 程序 开始 执行 之 前 进行 ， 并 且 初 始 化 表达 式 必 须 为 常量 表达 
式 。 每 次 进入 函数 或 程序 块 时 ， 显 式 初 始 化 的 目 动 变量 都 将 被 初始 化 
一 次 ， 其 初始 化 表达 式 可 以 是 任何 表达 式 。 默 认 情 况 下 ， 外 部 变 量 与 
静态 变量 将 被 初始 化 为 0。 未 经 显 式 初 始 化 的 目 动 变量 的 值 为 未 定义 
值 ( 即 无 效 值 ) 。 

任何 变量 的 声明 都 可 以 使 用 const 限定 符 限定 。 该 限定 从 指定 变量 的 
值 不 能 被 修改 。 对 数组 而 言 ，const 限定 符 指 定数 组 所 有 元 素 的 值 都 
不 能 被 修改 : 

const double e = 2.71828182845905; const char msg[] = "warning: "; 


a BRET tH AAC GAS BUA, ERI RKR EEE BEAR CAA 


int strlen(const char[]); 


如 果 试 图 修改 const 限定 符 限 定 的 值 ， 其 结果 取决 于 具体 的 实现 。 
2.5 算术 运算 符 


二 元 算术 运算 符 包括 :+、。、*、/、%( 取 模 运 算 符 )。 整 数 除法 会 截断 结 
果 中 的 小 数 部 分 。 表 达 式 

x%y 

的 结果 是 x 除 以 y 的 余数 ， 当 x 能 被 y 整除 时 ， 其 值 为 0。 例如， 如 
果 某 一 年 的 年 份 能 被 4 整除 但 不 能 被 100 EGR, AL AIMEE 
cea 能 被 400 整除 的 年 份 也 是 同年 。 因 此， 可 以 用 下 列 语句 判 
煌 国 年 : 


if ((year % 4 == 0 && year % 100 != 0) || year % 400 == 0) printf("%d is a 
leap year\n", year); 


else 


printf("%d is not a leap year\n", year); 


取 模 运算 符 % 不 能 应 用 于 float 或 double 类 型 。 在 有 负 操 作 数 的 情况 

T, BARAER 取 的 方向 以 及 取 模 运算 结 末 的 符号 取决 于 具体 机 器 的 
实现 ， 这 和 处理 上 次 或 下 淤 的 情况 是 一 样 的 。 

二 元 运算 符 + 和 。 具 有 相同 的 优先 级 ， 它 们 的 优先 级 比 运算 符 *、/ 和 % 的 
优先 级 低 ， 而 运 算 符 *、/ 和 % 的 优先 级 又 比 一 元 运算 符 + 和 的 优先 级 
低 。 算 术 运 算 符 采用 从 左 到 右 的 结合 规则 。 


本 章 末 尾 的 表 2.1 完整 总 结 了 所 有 运算 符 的 优先 级 和 结合 律 。 
2.6 关系 运算 符 与 逻辑 运算 符 

关系 运算 符 包括 下 列 几 个 运算 符 : 

> >= < <= 


它们 具有 相同 的 优先 级 。 优 先 级 仅 次 于 它们 的 古 相 等 性 运算 符 : 


二 二 l= 


关系 运算 符 的 优先 级 比 算术 运算 符 低 。 因 此 ， 表 达 式 1i<lim .1 等 价 于 
i< (im。1)。 逻辑 运算 符 && 与 | 有 一 些 较为 特殊 的 属性 ， 由 && 与 || 连 
接 的 表达 式 按 从 左 到 右 的 顺序 进 


行 求 值 ， 并 且 ， 在 知道 结果 值 为 真 或 假 后 立即 停止 计算 。 绝 大 多 数 C 
语言 程序 运用 了 这 些 属 


性 。 例 如 ， 下 列 在 功能 上 与 第 1 章 的 输入 函数 getline 中 的 循环 语句 等 
价 的 循环 语句 : 


for (i=0; i<limel && (c=getchar()) {= \n && c != EOF; ++i) s[i] = c; 
在 读 入 一 个 新 字符 之 前 必须 先 检 查 数 组 s 中 足 否 还 有 空间 存放 这 个 字 


符 ， 因 此 必须 首先 测试 条 件 i<lim*1。 如 果 这 一 测试 失败 ， 就 没有 必要 
继续 读 入 下 一 字符 。 


类 似 地 ， 如 果 在 调用 getchar KAZ BUM c 是 否 为 EOF， 结 果 也 是 
不 正确 的 ， 因 此 ， 函数 的 调用 与 赋值 都 必须 在 对 c 中 的 字符 进行 测试 
之 前 进行 。 

运算 符 && 的 优先 级 比 | 的 优先 级 高 ， 但 两 者 都 比 天 系 运 算 符 和 相等 性 
运算 符 的 优先 级 低 。 因 此 ， 表 达 式 

i<lime1 && (c = getchar()) != \n' && c!= EOF 


Weme AIMAS o (Be, TBR Sc Pee 
符 的 优先 级 ， 因 此 ， 在 表达 式 


(c= getchar()) {= ”\n' 


中 ， 职 需要 使 用 圆 括 号 ， 这 样 才 能 达到 预期 的 目的 : 先 把 函数 返回 值 赋 
值 给 c， 然 后 再 将 c 


与 \n' 进 行 比较 。 


根据 定义 ， 在 关系 表达 式 或 逻辑 表达 式 中 ， 如 采 关 系 为 真 ， 则 表达 式 
的 结果 值 为 数值 1; 如 采 为 假 ， 则 结 采 值 为 数值 0。 


逻辑 非 运算 符 ! 的 作用 是 将 非 0 操作 数 园 换 为 0， 将 操作 数 0 转换 为 
1° 该 运算 符 通常 用 于 下 列 类 似 的 结构 中 : 


if (!valid) 
一 般 不 采用 下 列 形 式 : 
if (valid == 0) 


当然 ， 很 难 评判 上 述 两 种 形式 哪 种 更 好 。 类 似 于 !valid 的 用 法 读 起 来 
ee 征 有 效 的 )， 但 对 于 一 些 更 复杂 的 结构 可 能 会 难 
理解 。 


练习 22 在 不 使 用 运算 符 && 或 | 的 条 件 下 编写 一 个 与 上 面 的 for 循环 语 
句 等 价 的 循 环 语句 。 


2.7 类 型 转换 


当 一 个 运算 符 的 几 个 操作 数 类 型 不 同时 ， 束 需要 通过 一 些 规则 把 它们 
转换 为 某 种 共同 的 类 型 。 一 般 来 说 ， 目 动 转 换 是 指 把 "比较 罕 的 "操作 
数 转换 为 "比较 宽 的 "操作 数 ， 并 且 不 丢失 信息 的 转换 ， 例 如 ， 在 计算 
表达 式 f+i 时 ， 将 整 型 变量 i 的 值 目 动 转换 为 浮 点 型 (这 里 的 变量 下 为 
浮 点 型 )。 不 允许 使 用 无 意义 的 表达 式 ， 例 如 ， 不 允许 把 float 类 型 的 

表达 式 作 为 下 标 。 针 对 可 能 导致 信息 丢失 的 表达 式 ， 编 译 右 可 能 会 给 
出 警告 信息 ， 比 如 把 较 长 的 整 型 值 赋 给 较 短 的 整 型 变量 ， 把 浮 点 型 值 
赋值 给 整 型 变量 ， 等 等 ， 但 这 些 表 达 式 并 不 非法 。 


由 于 char 类 型 就 古 较 小 的 整 型 ， 因 此 在 算术 表达 式 中 可 以 目 由 使 用 
char 类 型 的 变量 ， 这 殊 为 实现 某 些 字 符 转换 提供 了 很 大 的 灵活 性 ， 比 
如 ， 下 面 的 钞 数 atoi 就 是 一 例 ， 它 将 一 串 数字 转换 为 相应 的 数值 : 


/* atoi: convert s to integer */ int atoi(char s[]) 


{ 


inti, n; 
n = 0; 


for (i = 0; s[i] >= '0' && s[i] <= '9'; ++i) n = 10 * n + (s[i] ° '0'); 


return n; 

} 

我 们 在 第 1 章 讲 过 ， 表 达 式 
s[i] ° '0' 


能 够 计算 出 si FUE AH A OT DAE, ENN TEEF 
符 集 中 对 应 的 数 值 是 一 个 连续 的 递增 序列 。 


函数 lower 是 将 char 类 型 转换 为 int 类 型 的 另 一 个 例子 ， EK ASCII 
字符 集中 的 字符 映射 到 对 应 的 小 写字 母 。 如 果 竺 转换 的 字符 不 是 大 写 
FEL, lower 函数 将 返回 字符 本 里 。 


/* lower: convert c to lower case; ASCII only */ int lower(int c) 
{ 

if (c >='A' && c <='Z') 

return c + 'a' Ħ 'A'; else 

return C; 


} 


上 述 这 个 函数 是 为 ASCI 字符 集 设计 的 。 在 ASCII 字符 集中 ， 大 写字 
母 与 对 应 的 小 写字 母 作 为 数字 值 来 说 具有 固定 的 间隔 ， 并 且 每 个 字母 
表 都 是 连续 的 一 一 也 就 是 说 ， 在 A@z 之 间 只 有 字母。 但是， 后面 一 
点 对 EBCDIC 字符 集 是 不 成 立 的 ， 因 此 这 一 函数 作用 在 EBCDIC 字符 
集 中 就 不 仅 限于 转换 字母 的 大 小 写 。 


附录 B 介绍 的 标准 头 文 件 <ctype.h> 定 义 了 一 组 与 字符 集 无 天 的 测试 和 
转换 了 范 数 。 例 如 ， tolower(c)\LHACk c 转换 为 小 写 形式 (如 果 c 为 大 写 
形式 的 话 )， 可 以 使 用 tolower 40 上 述 lower 函数 。 类 似 地 ， 测 试 语 
fj 


c>='0' && c <= '9' 
可 以 用 该 标准 库 中 的 函数 
isdigit(c) 


蕉 代 。 在 本 书 的 后 壬 内 容 中 ， 我 们 将 使 用 <ctype.h> 中 走 义 的 函数 。 将 
字符 类 型 转换 为 整 型 时 ， 我 们 需要 注意 一 点 。C 语言 没有 指定 char 类 
型 的 变量 是 无 从 


号 变量 (signed) 还 是 市 符号 变量 (unsigned)。 当 把 一 个 char 类 型 的 值 转 
换 为 int 类 


型 的 值 时 ， 其 结果 有 没有 可 能 为 负 整 数 ?对 于 不 同 的 机 器 ， 其 结 采 也 不 
同 ， 这 反映 了 不 同 机 


右 结 构 之 间 的 区 别 。 在 某 些 机 器 中 ， 如 有 果 char 类 型 值 的 最 左 一 位 为 

1， 则 转换 为 负 整 数 (进行 "符号 扩展 ")。 而 在 男 一 些 机 器 中 ， 把 char 类 
型 值 转换 为 int 类 型 时 ， 在 char 类 型 值 的 左边 添加 0， 这 样 导致 的 转 
换 结果 值 总 是 正 值 。 


C 语言 的 定义 保证 了 机 硕 的 标准 打印 字符 集中 的 字符 不 会 是 负 值 ， 

此 ， 在 表达 式 中 这 些 字符 总 是 正 值 。 但 是 ， 存 储 在 字符 变量 中 的 位 模 
式 在 某 些 机 右 中 可 能 是 负 的 ， 而 在 另 一 些 机 器 上 可 能 十 正 的 。 为 了 保 
证 程序 的 可 移植 性 ， 如 果 要 在 char 类 型 的 变量 中 存储 非 字 符 数 据 ， 最 
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好 指定 signed 或 unsigned 限定 符 。 


当 关 系 表达 式 (如 ij) 以 及 由 &&、| 连 接 的 逻辑 表达 式 的 判定 结果 为 
真 时 ， 表 达 式 的 值 为 1 当 判 定 结果 为 假 时 ， 表 达 式 的 值 为 0。 因 此 ， 
对 于 赋值 语句 


d=c>='0' && c <= '9' 


来 说 ， 当 c 为 数字 时 ，d 的 值 为 1， 否 则 d 的 值 为 0°。 但 是 ， 某 些 函 数 
(比如 isdigit) 在 结 末 为 真 时 可 能 返回 任意 的 非 0 值 。 在 证、 while ` for 
等 语句 的 测试 部 分 中 ，" 真 "就 意味 着 " 非 0”， 这 二 者 之 间 没 有 区 别 。 


C 语言 中 ， 很 多 情况 下 会 进行 隐 式 的 算术 类 型 转换 。 一 般 来 说 ， 如 末 
二 元 运算 符 ( 具 有 两 个 操作 数 的 运算 符 称 为 二 元 运算 符 ， 比 如 + 或 *) 的 
两 个 操作 数 具有 不 同 的 类 型 ， 那么 在 进行 运算 之 前 先 要 把 " 较 低 "的 类 
型 提升 为 " 较 高 "的 类 型 ， 运 算 的 结果 为 较 高 的 类 型 。 附 隶 A.6 TEH 
地 列 出 了 这 些 转 换 规则 。 但 是 ， 如 果 没 有 unsigned 类 型 的 操作 数 ， 则 
只 要 使 用 下 面 这 些 非 正 式 的 规则 整 可 以 了 : 


如 果 其 中 一 个 操作 数 的 类 型 为 long double， 则 将 另 一 个 操作 
数 转换 为 long double 类 型 ; 


如 果 其 中 一 个 操作 数 的 类 型 为 double， 则 将 另 一 个 操作 数 转 
换 为 double 类 型 ; 


如 果 其 中 一 个 操作 数 的 类 型 为 float， 则 将 另 一 个 操作 数 转换 
H float 类型; 


将 char 与 short 类 型 的 操作 数 转换 为 int 类 型 ; 


如 果 其 中 一 个 操作 数 的 类 型 为 long， 则 将 另 一 个 操作 数 也 转 
换 为 long 类 型 。 


注意 ， 表 达 式 中 float 类 型 的 操作 数 不 会 目 动 转换 为 double RAY, JX 
RIRE 义 有 所 不 同 。 一 般 来 说 ， 数 学 函数 (如 标准 头 文件 
<math.h> 中 定义 的 函数 ) 使 用 双 精 度 类 型 的 变量 。 使 用 float 类 型 主要 
征 为 了 在 使 用 较 大 的 数组 时 节省 存储 空间 ， 有 时 也 为 了 节省 机 ae UT 
时 间 ( 双 精度 算术 运算 特别 费时 )。 


当 表 达 式 中 包含 unsigned 类 型 的 操作 数 时 ， 转 换 规 则 要 复杂 一 些 。 主 
要 原因 在 于 ， 带 符号 值 与 无 符号 值 之 间 的 比较 运算 是 与 机 器 相关 的 ， 
因为 它们 取决 于 机 器 中 不 同 整数 类 型 的 大小。 例如， 假定 int 类 型 占 
16 位 ，long 类 型 占 32 位 ， 那 么 ，*1L < 1U， 这 是 因为 unsighed int 类 
型 的 1U 将 被 提升 为 signed long 类 型 ;但 .1L > 1UL， 这 是 因为 1L 将 被 
提升 为 unslgned long 类 型 ， 因 而 成 为 一 个 比较 大 的 正 数 © 


赋值 时 也 要 进行 类 型 转换 。 赋 值 运算 符 右边 的 值 需要 转换 为 左边 变量 
的 类 型 ， 左 边 变 量 的 类 型 即 赋值 表达 式 结果 的 类 型 。 


前 面 提 到 过 ， 无 论 是 否 进行 符号 扩展 ， 字 符 型 变量 都 将 被 转换 为 整 型 
变量 。 当 把 较 长 的 整数 转换 为 较 短 的 整数 或 char 类 型 时 ， 超 出 的 高 位 
部 分 将 被 丢弃 。 因 此 ， 下 

列 程序 段 : 


int i; char c; 


i=Gc=4 


执行 后 ，c 的 值 将 保持 不 变 。 无 论 是 否 进行 符号 扩展 ， 该 结论 都 成 
Wee (ze, WRC NEVE 语句 的 次 序 题 倒 一 下 ， 则 执行 后 可 能 会 丢 


失信 息 。 


QU x Æ float RH, i 是 int 类 型 ， 那么 语句 x=i 与 1=x 在 执行 时 都 
要 进行 类 型 转换 。 当 把 float 类 型 转换 为 int 类 型 时 ， 小 数 部 分 将 被 截 
取 掉 ; 当 把 double 类 型 转换 为 float 类 型 时 ， 是 进行 四 舍 五 入 还 是 截取 
取决 于 具体 的 实现 。 


由 于 函数 调用 的 参数 是 表达 式 ， 所 以 在 把 参数 传递 给 函数 时 也 可 能 进 
行 类 型 转换 。 在 没有 函数 原型 的 情况 下 ，char 与 short 类 型 都 将 被 转 


换 为 int RAY, float 类 型 将 被 转换 为 double XÆ °- Ath, Bll eve) H EK 
数 的 参数 为 char 或 float 类 型 ， 我 们 也 把 函数 参数 声明 为 int 或 double 


最 后 ， 在 任何 表达 式 中 都 可 以 使 用 一 个 称 为 强制 类 型 转换 的 一 元 运 守 
符 强 制 进行 显 式 类 型 转换 。 在 下 列 语句 中 ， 表 达 式 将 按照 上 述 转换 规 
则 被 转换 为 类 型 名 指定 的 类 型 : 


(类 型 名 ) 表达 式 我 们 可 以 这 样 来 理解 强制 类 型 转换 的 准确 含义 :在 上 壕 
语句 中 ， 表 达 式 首先 被 赋值 给 类 型 名 

指定 的 类 型 的 某 个 变量 ， 然 后 再 用 该 变量 灰 换 上 述 整 条 语句 。 例 如 ， 
EKA sqrt 的 参数 为 


double 类 型 ， 如 果 处 理 不 当 ， 结 果 可 能 会 无 意义 (sqrt 在 <math.h> 中 声 
明 )。 因 此 ， 如 果 


n 是 整数 ， 可 以 使 用 

sqrt((double) n) 

在 把 n 传递 给 函数 sqrt 之 前 先 将 其 转换 为 double 类 型 。 注 意 ， 强 制 类 
型 转换 只 是 生成 一 个 指定 类 型 的 n 的 值 ，n 本 身 的 值 并 没有 改变 。 强 


制 类 型 转换 运算 符 与 其 它 一 元 运算 符 具有 相 同 的 优先 级 ， 表 21 对 运 
算 符 优先 级 进行 了 总结 。 


TABU T, Soe en UA RHA o IE, Sen eva 
时 ， 声 明 将 对 参数 进行 目 动 强制 转换 。 例 如 ， 对 于 sqrt AEN AUR Ae 


double sqrt(double); 
Ba eee H: 
root2 = sqrt(2): 
Ae BE AE FA TR rel] SEAL PS Hw OFF a AT LA AP ER 2 强制 转换 为 
double 类 型 的 值 2.0。 标准 库 中 包含 一 个 可 移植 的 实现 伪 随 机 数 发 生 
器 的 函数 rand 以 及 一 个 初始 化 种 子 数 的 
函数 srand。 前 一 个 函数 rand 使 用 了 强制 类 型 转换 。 
unsigned long int next = 1; 
/* rand: return pseudosrandom integer on 0.32767 */ int rand(void) 
{ 
next = next * 1103515245 + 12345; 
return (unsigned int)(next/65536) % 32768; 
} 
/* srand: set seed for rand() */ void srand(unsigned int seed) 
{ 
next = seed; 
} 


练习 293 编写 函数 htoi(s)， 把 由 十 六 进 制 数字 组 成 的 字符 串 ( 包 
A AY EA BBE Ox 


或 0X) 转 换 为 与 之 等 价 的 整 型 值 。 字 符 串 中 允许 包含 的 数字 包 
括 :0@9、a@f 以 及 A@F 。 


2.8 目 增 运算 符 与 目 威 运算 符 


C 语言 提供 了 两 个 用 于 变量 递增 与 递减 的 特殊 运算 符 。 目 增 运 算 符 
++ 使 其 操作 数 递 增 1， 目 减 运 算 符 使 其 操作 数 弟 减 1。 我 们 经 常 使 用 
++ 运 滤 符 递增 变量 的 值 ， 如 下 所 示 : 


if (c = ^n) 
++nl; 


HEE A MNA RIT TARNA EERME: EE DAA Fn a 
符 ( 用 在 变量 前 M, W+) ° Ha LAA (Ea See RA H Ee Ea, 
如 n++)。 在 这 两 种 情况 下 ， 其 效 打 都 是 将 变量 n 的 值 加 1。 但 是 ， 它 
们 之 间 有 一 点 不 同 。 表 达 式 ++n 先 将 n 的 值 递增 1， 然 后 再 使 用 变量 
n 的 值 ， 而 表达 式 n++ 则 征 移 使 用 变量 n 的 值 ， 然 后 再 将 n 的 值 递增 
1° 也 就 是 说 ， 对 于 使 用 变量 n 的 值 的 上 下 文 来 说 ，++n 和 n++ 的 效果 
是 不 同 的 。 如 果 n 的 值 为 5， 那 么 


x = 卫 十 十 ; 


执行 后 的 结果 是 将 x 的 值 置 为 5， 而 


X =+4n; 


将 x 的 值 置 为 6。 这 两 条 语句 执行 完成 后 ， 变 量 n 的 值 都 是 6。 目 增 与 
目 减 运算 从 只 能 作用 于 变量 ， 类 似 于 表达 式 (i+j)++ 古 非法 的 。 


在 不 需要 使 用 任何 具体 值 且 仅 需要 递增 变量 的 情况 下 ， 前 组 方式 和 后 
级 方式 的 效果 相同 。 例 如 : 


if (c == 'n') nl++; 


但 在 某 些 情况 下 需要 酌情 考 虚 。 例 如 ， 考 虚 下 面 的 琅 数 squeeze(s, c), 
它 删 除 字 符 串 s 


中 出 现 的 所 有 字符 c: 

/* squeeze: delete all c from s */ void squeeze(char s[], int c) 
{ 

int i, j; 


for (i = j = 0; s[i] != '\0'; i++) if (s[i] != ©) 

s[j++] = sli]; 

s[j] = '\0'; 

} 

每 当 出 现 一 个 不 是 c 的 字符 时 ， 该 函数 把 它 找 贝 到 数组 中 下 标 为 j 的 
位 置 ， 随 后 才 将 j 的 值 增加 1， 以 准备 处 理 下 一 个 字符 。 其 中 的 证 语 
名 完全 等 价 于 下 列 语句 : 

if (s[i] != © { 


s[j] = s[i]; j++; 
} 


我 们 在 第 1 章 中 编写 的 函数 getline 是 类 似 结构 的 另外 一 个 例子 。 我 们 
可 以 将 该 琅 数 中 的 证 语句 : 


if (c == ^n’) { s[i] = c; 


++i; 
} 

用 下 面 这 种 更 简洁 的 形式 代替 : 

if (c == "\n') 

s[i++] = c; 

我 们 再 来 看 第 三 个 例子 。 考 虑 标准 函数 streat(s, t)， 它 将 字符 串 t 连接 
到 字符 串 s 的 尾部 。 函 数 streat 假定 字符 串 s 中 有 足够 的 空间 保存 这 两 


个 字符 串 连 接 的 结 采 。 下 面 编 写 的 这 个 函数 没有 任何 返回 值 (标准 库 
中 的 该 画 数 返 回 一 个 指向 新 字符 串 的 指针 ): 


/* strcat: concatenate t to end of s; s must be big enough */ void 
strcat(char s[], char t[]) 


while (s[i] != \0) /* find end of s */ i++; 


while ((s[i++] = tlj++]) != '\0') /* copy t */ 


} 


在 将 t 中 的 字符 逐个 找 贝 到 s 的 尾部 时 ， 变 量 1 和 j HAA Ae aoe 
算 符 ++， 从 而 保证 在 


循环 过 程 中 i 与 j 均 指 癌 下 一 个 位 置 。 


练习 24 squeeze(s1, s2)， 将 字符 串 s1 中 任何 与 字符 串 s2 PF 
从 匹配 的 字符 都 删除 。 

练习 2.5 编写 函数 any(s1, s2)， 将 字符 串 s2 中 的 任 一 字符 在 字符 串 s1 
中 第 一 次 出 现 的 位 置 作为 结果 返回 。 如 果 sl 中 不 包含 s2 中 的 字符 ， 
则 返回 1。( 标 准 库 函 数 strpbrk 具有 同样 的 功能 ， 但 它 返 回 的 是 指 癌 该 
位 置 的 指针 。) 

2.9. 按 位 运算 符 


C 语言 提供 了 6 个 位 操作 运算 符 。 这 些 运 算 符 只 能 作用 于 整 型 操作 
数 ， 即 只 能 作用 于 带 符 SRE char ` short ` int ` long 类 型 : 


& 按 位 与 (AND) 


| 按 位 或 (OR) 

^ 按 位 异 或 (XOR) 
<< 左 移 

>> AE 


~ 按 位 求 反 (一 元 运算 符 ) 
按 位 与 运算 符 & 经 常用 于 屏蔽 某 些 二 进 制 位 ， 例 如 : 
n =n & 0177: 


该 语句 将 n PRR 7 个 低 二 进 制 位 外 的 其 它 各 位 均 置 为 0。 按 位 或 运算 
和 从 | 常用 于 将 某 些 二 进 制 位置 为 1， 例 如 : x =x|SET_ON; 


该 语句 将 x 中 对 应 于 SET_ON 中 为 1 的 那些 二 进 制 位置 为 1。 


按 位 异 或 运算 符 ^ 当 两 个 操作 数 的 对 应 位 不 相同 时 将 该 位 设置 为 1， 否 
则 ， 将 该 位 设置 为 


O° 


FMA AUF LIB LFF 8c PZE ARR KSRF, AFM 
左 至 右 求 表达 式 的 真 值 。 例 如 ， 如 果 x 的 值 为 1，YY 的 值 为 2， 那 
A, x&y 的 结果 为 0， 而 x &&y 的 值 为 1。 


移 位 运算 符 << 与 >> 分 别 用 于 将 运算 的 左 操 作 数 左 移 与 右 移 ， 移 动 的 位 
数 则 由 右 操 作 数 指 定 ( 右 操作 数 的 值 必须 是 非 负 值 )。 因 此 ， 表 达 式 x 
<<2 将 把 x 的 值 左 移 2 位 ， 右 边 空 出 的 2 位 用 0 填补， 该 表达 式 等 价 
于 对 左 操作 数 乘 以 4。 在 对 unsigned 类 型 的 无 符号 值 进行 右 移 位 时 ， 
左边 空 出 的 部 分 将 用 0 填补 ; 当 对 signed 类 型 的 带 符 号 值 进行 右 移 时 ， 
we Nae Rt 对 左边 空 出 的 部 分 用 符号 位 填补 ( 即 "算术 移 位 ")， 而 男 一 
些 机 妖 则 对 左边 空 出 的 部 分 用 0 填补 ( 即 "逻辑 移 位 ")。 


一 元 运算 从 ~ 用 于 求 整 数 的 二 进 制 反 码 ， 即 分 别 将 操作 数 各 二 进 制 位 
上 的 1 变 为 0,0 变 为 1。 例 如 : 


x =x & ~077 


将 把 x 的 最 后 6 位 设置 为 0。 注意 ， 表 达 式 x & ~077 与 机 器 字 长 无 
天 ， 它 比 形 式 为 x & 0177700 


的 表达 式 要 好 ， 同 为 后 者 假定 x 是 16 位 的 数值 。 这 种 可 移植 的 形式 并 
没有 增加 额外 开销 ， 


为 ，~077 是 利 量 表达 式 ， 可 以 在 编译 时 求 值 。 


为 了 进一步 说 明 某 些 位 运算 符 ， 我 们 来 看 贸 数 getbits(x, p, n)， 它 返回 
x 中 从 右边 数 第 p 位 开始 同 右 数 n 位 的 字段 。 这 里 假定 最 右边 的 一 位 
是 第 0 eee ae 都 是 合理 的 正 值 。 例 如 ，getbits(x, 4, 3) 返 回 x 中 第 
4、3、2 三 位 的 值 。 


/* getbits: get n bits from position p */ unsigned getbits(unsigned x, 
int p, int n) 


{ 
return (x >> (p+1°n)) & ~(~0 << n); 
} 


其 中 ， 表 达 式 m << (Pem Ba HY FBS Bl FA Ym ° ~O 
的 所 有 位 都 为 1， 这 里 使 用 语句 ~0 << n 将 ~0 左 移 n 位 ， 并 将 最 右边 
的 n 位 用 0 填补 。 再 使 用 ~ 运算 对 它 按 位 取 反 ， 这 样 束 建立 了 最 右边 
n 位 全 为 1 的 屏蔽 码 。 


练习 2。6 编写 一 个 函数 setbits(x, p, n, y), AKURE x 执行 下 列 操 
作 后 的 结果 值 : 将 x 中 从 第 p 位 开始 的 n 个 (二 进 制 ) 位 设置 为 y PRA 
Wn MRE, x WER 各 位 保持 不 变 。 

练习 2。7 编写 一 个 函数 invert(x, p, n)， 该 函数 返回 对 x 执行 下 列 操作 
后 的 结 果 值 :将 x 中 从 第 p 位 开始 的 n 个 (二 进 制 ) 位 求 反 ( 即 ，1 变 成 
0，0 变 成 1), x 的 其 余 各 位 保持 不 变 。 

练习 298 编写 一 个 函数 rightrot(x, n)， 该 函数 返回 将 x 循环 右 移 ( 即 从 
最 右 端 移出 的 位 将 从 最 左 端 移 入 )n( 二 进 制 ) 位 后 所 得 到 的 值 。 


2.10 赋值 运算 符 与 表达 式 在 赋值 表达 式 中 ， 如 果 
表达 式 左 边 的 变量 重复 出 现在 表达 式 的 右边 ， 如 : 


i = 1+2 


则 可 以 将 这 种 表达 式 缩 写 为 下 列 形式 : 
i+=2 


其 中 的 运算 符 += 称 为 赋值 运算 符 。 大 多 数 二 元 运算 符 ( 即 有 左 、 右 两 
个 操作 数 的 运算 符 ， 比 如 +) 都 有 一 个 相应 的 赋值 运算 


符 op=， 其 中 ，op 可 以 是 下 面 这 些 运算 符 之 一 : 


+ 。 * / % << >> & 
m | 如 果 expr1 和 expr2 是 表达 式 ， 那 么 exprl op= expr2 


expr1 = (expr1) op (expr2) 


它们 的 区 别 在 于 ， 前 一 种 形式 expri 只 计算 一 次 。 注 意 ， 在 第 二 种 形 
式 中 ，expr2 两 边 的 圆 括号 是 必 不 可 少 的 ， 例 如 ， 


x*=yt+1 
的 含义 是 : 
K=x*(y+1) 
而 不 是 
x=x*y+1 


我 们 这 里 举例 说 明 。 下 面 的 画 数 bitcount 统计 其 整 型 参数 的 值 为 1 的 
二 进 制 位 的 个 数 。 


/* bitcount: count 1 bits in x */ int bitcount(unsigned x) 
{ 

int b; 

for (b = 0; x != 0; x >>= 1) if (x & 01) 

b++; 

return b; 


} 


这 里 将 x 声明 为 无 符号 类 型 是 为 了 保证 将 x 右 移 时 ， 无 论 该 程序 在 什 
么 机 器 上 运行 ， 左 边 空 出 的 位 都 用 “0( 而 不 是 符号 位 ) 填 补 。 


除了 俏 洁 外 ， 赋 值 运算 符 还 有 一 个 优点 :表示 方式 与 人 们 的 思维 习惯 比 
较 接 近 。 我 们 通 常会 说 "把 2 加 到 i 上 "或 "把 i 增加 2"， 而 不 会 说 " 取 i 
的 值 ， 加 上 2， 再 把 结果 放 回 到 i 中 "， 因 此 ， 表 达 式 i+=2 比 i=i+2 
更 目 然 ， 男 外 ， 对 于 复杂 的 表达 式 ， 例 如 : 


yyvallyypv[p3+p4] + yypvlp1+p2]] += 2 
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检查 两 个 长 表达 式 是 否 完全 一 样 ， 也 无 须 为 两 者 为 什么 不 一 样 而 疑惑 
DiR, FH, MESELA DT mika 产生 高 效 代码 。 


从 上 述 例子 中 我 们 可 以 看 出 ， 赋 值 语 句 具 有 值 ， 且 可 以 用 在 表达 式 
中 。 下 面 征 最 常见 的 一 个 例子 : 


while ((c = getchar()) !=EOF) 

其 它 赋 值 运算 待 (如 +=、*= 等 ) 也 可 以 用 在 表达 式 中 ， 尽 管 这 种 用 法 比 
较 少 见 。 在 所 有 的 这 类 表达 式 中 ， 赋 全 表达 式 的 类 型 是 它 的 左 操 作 数 
的 类 型 ， 其 值 是 赋值 操作 完 

成 后 的 值 ， 

练习 299 在 求 对 二 的 补 码 时 ， 表 达 式 x &= (x 一 1) 可 以 删除 x 中 


最 右边 值 为 1 的 一 个 二 进 制 位 。 请 解释 这 样 做 的 道理 。 用 这 一 方法 重 
& bitcount 函数 ， 以 加 快 其 执行 速度 。 


2.11 条 件 表 达 式 
下 面 这 组 语句 : 
if (a > b) 


Zz =a; else 


z = b; 
用 于 求 a 和 b 中 的 最 大 值 ， 并 将 结 采 保存 到 z 中 。 条 件 表达 式 ( 使 用 三 


元 运算 符 “? "be 供 了 另外 一 种 方法 编写 这 段 程 序 及 类 似 的 代码 段 ， 
在 表达 式 


exprl ? expr2 : expr3 


中 ， 首 先 计 算 expr1， 如 果 其 值 不 等 于 0( 为 真 )， 则 计算 expr2 的 值 ， 
并 以 该 值 作 为 条 件 表达 式 的 值 ， 否 则 计算 expr3 的 值 ， 并 以 该 值 作为 
条 件 表达 式 的 值 。expr2 与 expr3 中 只 能 有 一 个 表达 式 被 计算 。 
此 ， 以 上 语句 可 以 改写 为 : 


z=(a>b)?a:b; /* z= max(a, b) */ 
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式 可 以 使 用 的 任何 地 方 ;如 果 expr2 与 expr3 的 类 型 不 同 ， 结 果 的 类 型 
将 由 本 章 前 面 讨论 的 转换 规则 决定 。 例 如 ， 如 果 f 为 float 类 型 ，n 为 
int 类 型 ， 那 么 表达 式 

(n>0)?f:n 


ze float 类 型 ， 与 n 古 否 为 正 值 无 关 。 条 件 表 达 式 中 第 一 个 表达 式 两 
边 的 圆 括 号 并 不 是 必须 的 ， 这 是 因为 条 件 运算 符 ? 的 优先 


级 非常 低 ， 仅 高 于 赋值 运算 符 。 但 我 们 还 是 建议 使 用 圆 括号 ， 因 为 这 
可 以 使 表达 式 的 条 件 部 

分 更 易于 阅读 。 

采用 条 件 表达 式 可 以 编写 出 很 简洁 的 代码 。 例 如 ， 下 面 的 这 个 循环 语 
名 打印 一 个 数组 的 mn 个 元 素 ， 每 行 打印 10 个 元 素 ， 每 列 之 间 用 一 个 空 
格 隔 开 ， 每 行 用 一 个 换行 符 结束 (包括 最 后 一 行 ) 


for (i = 0; i < n; i++) 


printf("%6d%c", ali], (1%10==9 !! i==ne1) ? ^\n':' 9; 


在 每 10 个 元 素 之 后 以 及 在 第 n 个 元 素 之 后 都 要 打印 一 个 换行 符 ， 所 有 
其 它 元 素 后 都 要 打印 一 个 空格 。 编 写 这 样 的 代码 可 能 需要 一 些 技巧 ， 
if*else 结构 编写 的 代码 要 紧 叶 一 些 。 下 面 是 另 一 个 比较 
了 的 例子 : 


printf("You have %d item%s.\n", n, n==1 ? "" : "s"); 


练习 2910 重新 编写 将 大 写字 母 较 换 为 小 写字 母 的 函数 lower， 并 用 条 
(PIA TVET PHY ifselse 结构 。 


2.12 运算 符 优先 级 与 求 值 次 序 


#291 总 结 了 所 有 运算 符 的 优先 级 与 结合 性 ， 其 中 的 一 些 规 则 我 们 还 

没有 讲述 。 同 一 行 中 的 各 运算 符 具 有 相同 的 优先 级 ， 各 行 间 从 上 往 下 
优先 级 隶 行 降低 。 例 如 ，*、/ 与 % 三 者 具有 相 同 的 优先 级 ， 它 们 的 优 

先 级 都 比 二 元 运算 符 +、* 高 。 运 算 符 ( ) 表 示 画 数 调 用 。 运 算 符 .> 和 .用 
于 访问 结构 成 员 ， 第 6 草 将 讨论 这 两 个 运算 符 以 及 sizeof( 对 象 长 度 ) 运 
算 符 。 第 5 BEY 

讨论 运算 符 *( 通 过 指针 间接 访问 ) 与 &( 对 象 地 址 )， 第 3 ATs 


运算 符 。 


#21 运算 符 的 优先 级 与 结合 性 


Di 


算 符 生生 性 


OU+> 


主 :一 元 运算 符 +、、 & 与 * 比 相应 的 二 元 运算 符 +、、& 与 * 的 优先 级 


TEAR, HOB RAR > 4 与 的 优先 级 比 运算 待 == 与 := 的 低 。 这 意味 着 ， 位 
测试 表达 式 ， 如 


if (x & MASK) == 0) ... 

必须 用 圆 括号 括 起 来 才能 得 到 正确 结果 。 

同 大 多 数 语言 一 样 ，C 语言 没有 指定 同一 运算 符 中 多 个 操作 数 的 计算 
IFR ` > 2: 和 ,运算 符 除 外 )。 例 如 ， 在 形 如 

x =f) + g0; 

的 语句 中 ，f0 可 以 在 g0 之 前 计算 ， 也 可 以 在 g80 之 后 计算 。 因 此 ， 如 

ARRAN f BK g AÈ 了 另 一 个 函数 所 使 用 的 变量 ， 那 么 x 的 结果 可 能 会 
依赖 于 这 两 个 函数 的 计算 顺序 。 为 了 保证 特定 的 计算 顺序 ， 可 以 把 中 
间 结 采 你 存在 临时 变量 中 。 

类 似 地 ，C 语言 也 没有 指定 函数 各 参数 的 求 值 顺序 。 因 此 ， 下 列 语句 

printf("%d %d\n", ++n, power(2, n)); /* $ */ 

在 不 同 的 编译 絮 中 可 能 会 产生 不 同 的 结果 ， 这 取决 于 n 的 目 增 运算 在 
power 调用 之 前 还 是 之 后 执行 。 解决 的 办 法 是 把 该 语句 改写 成 下 列 形 


++n; 
printf("%d %d\n", n, power(2, n)); 


函数 调用 、 磐 套 赋 值 语 句 、 目 增 与 目 城 运算 符 都 有 可 能 产生 "副作用 ” 
在 对 表达 式 求 值 的 同时 ， 修 改 了 某 些 变量 的 值 。 在 有 副作用 影响 
的 表达 式 中 ， 其 执行 结果 同 表 达 式 中 的 变量 被 修改 的 顺序 之 间 存 在 着 
微妙 的 依赖 关系 ， 下 列 语句 束 是 一 个 典型 的 令 人 不 愉快 的 情 疯 : 


ali] = i++; 


问题 是 :数组 下 标 i 5l BIA | BT PL a REE 
可 能 不 同 ， 并 因此 产生 不 同 的 结果 。C 语言 标准 对 大 多 数 这 类 问题 有 
意 未 作 具 体 规定 。 表 达 式 何 时 会 产生 这 种 副 作用 (对 变量 赋值 )， 将 由 
编译 器 决 是 ， 因 为 最 佳 的 求 值 顺序 同 机 器 结构 有 很 大 关系 。(ANSIC 
标准 明确 规定 了 所 有 对 参数 的 副作用 都 必须 在 函数 调用 之 前 生效 ， 但 
这 对 前 面 介绍 的 printf 


函数 调用 没有 什么 帮助 。) 


在 任何 一 种 编程 语言 中 ， 如 有 宋代 码 的 执行 结果 与 求 值 顺序 相关 ， 则 都 
征 不 好 的 程序 设计 风格 。 很 目 然 ， 有 必要 了 解 哪些 问题 需要 避免 ， 但 
古 ， 如 末 不 知道 这 些 问 题 在 各 种 机 器 上 古 如 何 解决 的 ， 束 最 好 不 要 壬 
试 运 用 某 种 特殊 的 实现 方式 。 


第 3 章 控制 流 


程序 语言 中 的 控制 流 语句 用 于 控制 各 计算 操作 执行 的 次 序 。 在 前 面 的 
例子 中 ， 我 们 曾经 使 用 了 一 些 最 音 用 的 控制 流 结构 。 本 章 将 更 详细 地 
讲述 控制 流 语 句 。 


3.1 语 旬 与 程序 块 


在 X= 0、i++ 或 printf(...) 这 样 的 表达 式 之 后 加 上 一 个 分 号 (;)， 它 们 就 
变 成 了 语句 。 例 如: 


x = 0; i++; 


printf(...); 


在 C 语言 中 ， 分 号 是 语句 结束 符 ， 而 Pascal 等 语言 却 把 分 号 用 作 语句 
之 间 的 分 隔 符 。 用 一 对 花 括号 {" 与 “}" 把 一 组 声明 和 语句 括 在 一 起 就 
构成 了 一 个 复合 语句 (也 叫 作 
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来 的 语句 便 是 明显 一 例 。 


if ` else, while 与 for 之 后 被 花 括号 括 住 的 多 条 语句 也 是 类 似 的 例子 。 
(在 任何 程序 块 中 都 可 以 声明 变量 ， 第 4 章 将 对 此 进行 讨论 。) 右 花 括 
号 用 于 结束 程序 块 ， 其 后 不 需要 分 号 。 


3.2 ifeelse 语 旬 

ifelse 语句 用 于 条 件 判定 ， 其 语法 如 下 所 示 : 
if {表达 式 } 

语句 1 


else 


语句 2 

其 中 else 部 分 是 可 选 的 。 该 语句 执行 时 ， 移 计算 表达 式 的 值 ， 如 果 其 
值 为 真 ( 即 表达 式 的 值 为 非 0)， 则 执行 语句 1 如 果 其 值 为 假 ( 即 表达 式 
的 值 为 0)， 并 且 该 语句 包含 else 部 分 ， 则 执行 语句 ° 


由 于 证 语句 只 是 简单 测试 表达 式 的 数值 ， 因 此 可 以 对 某 些 代码 的 编写 
进行 位 化 。 最 明显 的 例子 是 用 如 下 写法 


if (表达 式 ) 

KARE 

if (表达 式 !0) 

某 些 情况 下 这 种 形式 是 目 然 清晰 的 ， 但 也 有 些 情况 下 可 能 会 含义 不 

清 。 

因为 ifeelse 语句 的 else 部 分 是 可 选 的 ， 所 以 在 嵌 套 的 话语 句 中 省 略 它 


的 else 部 分 将 导致 上 层 义 。 解 决 的 方法 是 将 每 个 else 与 最 近 的 前 一 个 没 
有 else 配对 的 if 进行 匹配 。 


例如 ， 在 下 列 语句 中 : 
if (n > 0) 

if (a >b) 

z = a; else 

z =b; 


else 部 分 与 内 层 的 让 匹配 ， 我 们 通过 程序 的 缩 进 结构 也 可 以 看 出 来 。 
如 果 这 不 符合 我 们 的 意图 ， 则 必须 使 用 花 括 号 强制 实现 正确 的 匹配 天 


ZJN e 


if (n > 0) { if (a>b) 


else 

Z = b; 

歧义 性 在 下 面 这 种 情况 下 尤为 有 害 : 
if (n > 0) 

for (i = 0; i < n; i++) if (s[i] > 0) { 
printf("..."); return i; 

} 

else /* WRONG */ 


printf("error ** n is negative\n"); 


程序 的 缩 进 结构 明确 地 表明 了 设计 意图 ， 但 编译 种 无 法 获得 这 一 信 
A, ER else 部 分 与 内 层 的 让 配对 。 这 种 错误 很 难 发 现 ， 因 此 我 们 
ENEA if HORENIE MERI ° 

顺便 提醒 读者 注意 ， 在 语句 


if (a > b) 


z= a; else 
z = b; 
中 ，z=a 后 有 一 个 分 号 。 这 是 因为 ， 从 语法 上 讲 ， 跟 在 证 后 面 的 应 该 


是 一 条 语句 ， 而 像 * z=a;” 

这 类 的 表达 式 语句 总 是 以 分 号 结束 的 。 
3.3 else*if 语 名 

在 C 语言 中 我 们 会 经 常用 到 下 列 结构 : 
if (表达 式 ) 

语句 

else if (表达 式 ) 

语句 

else if (表达 式 ) 

语句 

else if (表达 式 ) 

语句 


else 


语句 


因此 我 们 在 这 里 单独 说 明 一 下 。 这 种 if VR APS ee a A RE Be 
用 的 方法 。 其 中 的 各 表 达 式 将 被 依次 求 值 ， 一 旦 某 个 表达 式 结 采 为 
真 ， 则 执行 与 之 相关 的 语句 ， 并 终止 整个 语句 序 列 的 执行 。 同 样 ， 其 
中 各 语句 既 可 以 是 单条 语句 ， 也 可 以 是 用 花 括 号 括 住 的 复合 语句 。 


最 后 一 个 else 部 分 用 于 处 理 " 上 述 条 件 均 不 成 立 " 的 情况 或 默认 情况 ， 
也 就 是 当 上 面 各 条 件 都 不 满足 时 的 情形 。 有 时 候 并 不 需要 针对 默认 情 
况 执行 显 式 的 操作 ， 这 种 情况 下 ， 可 以 把 该 结构 末尾 的 


else 
二 全 


部 分 省 略 掉 ; 该 部 分 也 可 以 用 来 检查 错误 ， 以 捕获 "不 可 能 "的 条 件 。 这 
里 通过 一 个 折 半 查找 函数 说 明 三 路 判定 程序 的 用 法 。 该 贸 数 用 于 判定 
已 排序 的 数组 v 


中 是 否 存 在 某 个 特定 的 值 x。 数 组 v 的 元 素 必须 以 升序 排列 。 如 果 v 
中 包含 x， 则 该 函数 返回 


x 在 v 中 的 位 置 ( 介 于 0@ne1 之 间 的 一 个 整数 ); 和 否则， 该 画 数 返回 "1。 


在 折 半 查找 时 ， 首 先 将 输入 值 x 与 数组 v 的 中 间 元 素 进行 比较 。 如 果 
x 小 于 中 间 元 素 的 值 ， 则 在 该 数组 的 前 半 部 分 查找 ;否则 ， 在 该 数组 的 
后 半 部 分 查找 。 在 这 两 种 情况 下 ， 下 一 步 都 是 将 x 与 所 选 部 分 的 中 间 
TREIE AET FE, BAREEN AR 


/* binsearch: find x in v[0] <= v[1] <=... <= v[ne1] */ int 
binsearch(int x, int v[], int n) 


{ 
int low, high, mid; 
low = 0; 


high =n 1; 


while (low <= high) { mid = (low+high)/2; if (x < v[mid]) 
high = mid + 1; else if (x > v[mid]) 


low = mid + 1; 


else /* found match */ return mid; 
} 

return °1; /* no match */ 

} 


TAR ASA A Ee FE i x 小 于 、 大 于 还 是 等 于 中 间 元 素 
v[mid]。 使 用 else*if 结构 执行 这 种 判定 很 目 然 。 


练习 3*1 在 上 面 有 关 折 半 查 找 的 例子 中 ，while 循环 语句 内 共 执行 了 两 
次 测试 ， 其 实 只 要 一 次 就 足够 (代价 是 将 更 多 的 测试 在 循环 外 执行 ) 。 
重 写 该 曙 数 ， 使 得 在 循环 内 部 只 执行 “次 测试 ”比较 两 种 版 本 甸 数 的 
运行 时 间 。 


3.4 switch 语句 


switch 语句 是 一 种 多 路 判定 语句 ， 它 测试 表达 式 是 否 与 一 些 贡 量 整数 
值 中 的 某 一 个 值 匹配 ， 并 执行 相应 的 分 支 动作 。 


switch (表达 式 ) { 
case 常量 表达 式 : 语句 序列 
case 常量 表达 式 : 语句 序列 
default: 语句 序列 


每 一 个 分 文 都 由 一 个 或 多 个 整数 值 常 量 或 常量 表达 式 标记 。 如 果菜 个 
分 文 与 表达 式 的 值 匹配 ， 则 从 该 分 支 开始 执行 。 各 分 文 表达 式 必 须 互 
不 相同 。 如 有 果 没 有 哪 一 分 文 能 匹配 表达 式 ， 则 执 行 标 记 为 default 的 分 
文 。default 分 文 是 可 选 的 。 如 条 没 有 default 分 文 也 没有 其 它 分 文 与 

表达 式 的 值 匹配 ， 则 该 switch 语句 不 执行 任何 动作 。 各 分 文 及 default 
分 文 的 排列 次 序 是 任意 的 。 


我 们 在 第 1 章 中 曾 用 if...else if...else 结构 编写 过 一 个 程序 以 统计 各 个 
NS TA 符 及 其 它 所 有 字符 出 现 的 次 数 。 下 面 我 们 用 switch 语句 改 
ERETT a F: 


#include <stdio.h> 

main() /* count digits, white space, others */ 

{ 

int c, i, nwhite, nother, ndigit[10]; 

nwhite = nother = 0; 

for (i = 0; i < 10; i++) ndigit[i] = 0; 

while ((c = getchar()) != EOF) { switch (c) { 

case '0': case '1': case '2': case '3': case '4': 

case '5': case '6': case '7': case '8': case '9': ndigit[ce'0']++; 


break; case '': 


case '\n': 

case '\t': 

nwhite++; break; 

default: 

nother++; break; 

} 

} 

printf("digits ="); 

for (i = 0; i < 10; i++) printf(" %d", ndigit[i]); 

printf(", white space = %d, other = %d\n", nwhite, nother); 

return 0; 

} 

break 语句 将 导致 程序 的 执行 立即 从 switch 语句 中 退出 。 在 switch 语 
AJP, case 的 作用 只 是 一 个 标号 ， 因 此 ， 某 个 分 文中 的 代码 执行 完 
后 ， 程 序 将 进入 下 一 分 文 继续 执行 ， 除非 在 程序 中 显 式 地 跳 转 。 跳 出 
switch 语句 最 常用 的 方法 是 使 用 break 语句 与 return 语 句 。break 语句 
还 可 强制 控制 从 while ` for 与 do 循环 语句 中 立即 退出 ， 对 于 这 一 点 ， 
我 们 稍 后 还 将 做 进一步 介绍 。 

依次 执行 各 分 支 的 做 法 有 优点 也 有 缺点 。 好 的 一 面 是 它 可 以 把 若干 个 


分 文 组 合 在 一 起 完 成 一 个 任务 ， 如 上 例 中 对 数字 的 处 理 。 但 是 ， 正 党 
TROL PAT RG Bet RR SMT, 


每 个 分 文 后 必须 以 一 个 break 语句 结束 。 从 一 个 分 文 直 接 进 入 下 一 个 

分 文 执行 的 做 法 并 不 健全， 这 样 做 在 程序 修改 时 很 容易 出 错 。 除 了 一 
个 计算 需要 多 个 标号 的 情况 外 ， 应 尽量 减少 从 一 个 分 文 直 接 进 入 下 一 
个 分 文 执行 这 种 用 法 ， 在 不 得 不 使 用 的 情况 下 应 该 加 上 适当 的 程序 注 


YESS 


RE ° 


作为 一 种 民 好 的 程序 设计 风格 ， 在 switch 语句 最 后 一 个 分 文 ( 即 default 
分 文 ) 的 后 面 也 加 上 一 个 break 语句 。 这 样 做 在 逻辑 上 没有 必要 ， 但 当 
Bel te BAIA switch 语句 后 添 加 其 它 分 文 时 ， 这 种 防范 措施 会 降低 犯 
错误 的 可 能 性 。 


练习 3.2 编写 一 个 函数 escape(s, t)， 将 字符 串 t 复 制 到 字符 串 s 中， 并 
在 复制 过 程 中 将 换行 符 、 制 表 符 等 不 可 见 字 符 分 别 转换 为 mv、 At 等 相 

应 的 可 见 的 转 义 字符 序列 。 要 求 使 用 swich 语句 。 再 编写 一 个 具有 相 
反 功 能 的 函数 ， 在 复制 过 程 中 将 转 义 字符 序列 转换 为 实际 字符 © 


3.5 while 盾 不 与 for BA 

我 们 在 前 面 已 经 使 用 过 while 与 for 循环 语句 。 在 while 循环 语句 
while (表达 式 ) 

语句 


中 ， 首 先 求 表 达 式 的 值 。 如 果 其 值 非 0， 则 执行 语句 ， 并 再 次 求 该 表 
达 式 的 值 。 这 一 循环 过 程 一 直 进 行 下 去 ， 直 到 该 表达 式 的 值 为 0 为 
止 ， 随 后 继续 执行 语句 后 面 的 部 分 。 

for 循环 语句 ; 

for (表达 式 1; 表达 式 2; RIAR 3) 

语句 

它 等 价 于 下 列 while 语句 : 表达 式 1; 


while (表达 式 2) { 


ie Al 
FIAT 3; 
} 


但 当 while 或 for 循环 语句 中 包含 continue AJAY, vt =z [ALAN 
一 定 等 从 了 。 我 们 将 在 3.7 节 中 介绍 continue 语句 。 


从 语法 角度 看 ，for 循环 语句 的 3 个 组 成 部 分 都 是 表达 式 。 最 常见 的 情 
况 定 ， 表 达 式 1 


与 表达 式 3 是 赋值 表达 式 或 函数 调用 ， 表 达 式 2 是 关系 表达 式 。 这 3 
个 组 成 部 分 中 的 任何 部 


分 都 可 以 省 略 ， 但 分 号 必须 保留 。 如 采 在 for 语句 中 省 略 表达 式 1 与 
表达 式 3， 它 就 退化 成 


了 while 循环 语句 。 如 采 省 略 测试 条 件 ， 即 表达 式 2， 则 认为 其 值 永远 
是 真 值 ， 因 此 ， 下 列 


for 循环 语句 : 


for (53) { 


} 


是 一 个 "无 限 "循环 语句 ， 这 种 语句 需要 借助 其 它 手段 (如 break 语句 或 
return 语句 ) 才 能 终止 执行 。 


在 设计 程序 时 到 底 选 用 while 循环 语句 还 是 for 循环 语句 ， 主 要 取决 于 
程序 设计 人 员 的 


MAWE ° GINO, TER BAe: 
while ((c = getchar()) == '' || c == An || c = '\t) 

/* skip white space characters */ 
因为 其 中 没有 初始 化 或 重新 初始 化 的 操作 ， 所 以 使 用 while 循环 语句 
更 目 然 一 些 。 如 采 语 句 中 需要 执行 简单 的 初始 化 和 变量 递增 ， 使 用 
for 语句 更 合适 一 些 ， 它 将 循环 控 


制 语句 集中 放 在 循环 的 开头 ， 结 构 更 紧 痰 、 更 清晰 。 通 过 下 列 语句 可 
以 很 明显 地 看 出 这 一 点 : 


for (i = 0; i < n; i++) 


这 是 C 语言 处 理 数 组 前 n 个 元 素 的 一 种 习惯 性 用 法 ， 它 类 似 于 Fortran 
语言 中 的 DO 循环 或 Pascal 语言 中 的 for 循环 。 但 是 ， 这 种 类 比 并 不 
完全 准确 ， 因 为 在 C 语言 中 ，for 循环 语句 的 循环 变量 和 上 限 在 循环 
体内 可 以 修改 ， 并 且 当 循环 因 某 种 原因 终止 后 循环 变量 i 的 值 仍然 保 
留 。 因 为 for 语句 的 各 组 成 部 分 可 以 是 任何 表达 式 ， 所 以 for 语句 并 不 
限于 通过 算术 级 数 进行 循环 控制 。 尽 管 如 此 ， 牵 强 地 把 一 些 无 天 的 计 
算 放 到 for 语句 的 初始 化 和 变量 递增 部 分 是 一 种 不 好 的 程序 设计 风 
格 ， 该 部 分 放置 循环 控制 运算 更 合适 。 


作为 一 个 较 大 的 例子 ， 我 们 来 重新 编写 将 字符 串 转换 为 对 应 数值 的 画 
数 atoi 。 这 里 编写 的 负数 比 第 2 章 中 的 atoi 画 数 更 通用 ， 它 可 以 处 理 
可 选 的 前 导 空 白 符 以 及 一 个 可 选 的 加 (+) 或 减 () 号 。( 第 4 章 将 介绍 画 
数 atof， 它 用 于 对 浮 点 数 执行 同样 的 转换 。) 


下 面 是 程序 的 结构 ， 从 中 可 以 看 出 输入 的 格式 : 


如 膝 有 空白 符 的 话 ， 则 跳 过 如 果 有 符号 的 话 ， 则 读 取 符号 取 整 数 部 
分 ， 并 执行 转换 

其 中 的 每 一 步 都 对 输入 数据 进行 相应 的 处 理 ， 并 为 下 一 步 的 执行 做 好 
准备 。 当 遇 到 第 一 个 不 能 转换 为 数字 的 字符 时 ， 整 个 处 理 过 程 终止 。 


#include <ctype.h> 

/* atoi: convert s to integer; version 2 */ int atoi(char s[]) 
{ 

int i, n, sign; 


for (i = 0; isspace(s[i]); i++) /* skip white space */ 


sign = (s[i] == '*') ? °1 : 1; 

if (s[i] == '+' || s[i] == "*") /* skip sign */ i++; 
for (n = 0; isdigit(s[i]); i++) 

n= 10 * n + (s[i] ° '0'); return sign * n; 

} 


标准 库 中 提供 了 一 个 更 完善 的 函数 strtol, EET BRIAN KE 
Zt o ARN strtol 


的 详细 信息 ， 请 参见 附录 B.S 1 e 


把 循环 控制 部 分 集中 在 一 起 ， 对 于 多 重 骨 套 人 循环 ， 优 势 更 为 明显 。 下 
面 的 贸 数 是 对 整 型 数组 进行 排序 的 Shell 排序 算法 。Shell 排序 算法 是 
D. L. Shell 于 1959 年 发 明 的 ， 其 基本 思想 古 : 先 比 较 距离 远 的 元 于 ， 
而 不 是 像 窒 单 交换 排序 算法 那样 移 比较 相 邻 的 元 素 。 这 样 可 以 快 


PRD ANIC Tao, STS ALF o BEC BCA IC AR EAS 
距离 逐步 减少 ， 直 到 减 少 为 1， 这 时 排序 变 成 了 相 邻 元 素 的 互 换 。 


/* shellsort: sort v[O]...v[ne1] into increasing order */ void 
shellsort(int v[], int n) 
{ 


int gap, i, j, temp; 

for (gap = n/2; gap > 0; gap /= 2) for (i = gap; i < n; i++) 
for (j=iegap; j>=0 && v[j]>v[j+gap];j*=gap) { temp = vlj]; 
vlj] = vij+gap]; vij+gap] = temp; 

} 


} 


FRM eS = BREA for 循环 语句 。 最 外 层 的 for 语句 控制 两 
个 被 比较 元 素 之 间 的 距离 ， 从 m2 开始 ， 逐 步 进行 对 折 ， 直 到 距离 为 
0。 中 间 层 的 for AINEA TETTA HE 动 位 置 。 最 内 层 的 for 语句 
用 于 比较 各 对 相距 gap 个 位 置 的 元 素 ， 当 这 两 个 元 素 逆序 时 把 它 们 互 
换 过 来 。 由 于 gap 的 值 最 终 要 递减 到 1， 因 此 所 有 元 素 最 终 都 会 位 于 

正确 的 排序 位 置 上 。 注意 ， 即 使 最 外 层 for 循环 的 控制 变量 不 征 算术 

BEN, for 语句 的 书写 形式 仍然 没有 变 ， 这 BULA for 语句 共有 很 强 的 


通用 性 


和 逗号 运算 符 “ ," 也 是 C 语言 优先 级 最 低 的 运算 符 ， 在 for 语句 中 经 常会 
FABRIC © PI 号 分 隔 的 一 对 表达 式 将 按照 从 左 到 右 的 顺序 进行 求 值 ， 
表达 式 右 边 的 操作 数 的 类 型 和 值 即 为 其 结果 的 类 型 和 值 。 这 样 ， 在 
for 循环 语句 中 ， 可 以 将 多 个 表达 式 放 在 各 个 语句 成 分 中 ， 比 如 同时 
处 理 两 个 循环 控制 变 掌 。 我 们 可 以 通过 下 面 的 范 数 reverse(s) 来 举例 。 
该 函数 用 于 倒置 字符 串 s 中 各 个 字符 的 位 置 。 


#include <string.h> 


/* reverse: reverse string s in place */ void reverse(char s[]) 
{ 

int ç, 1, j; 

for (i = 0, j = strlen(s)e1; i < j; i++, jee) { c = si]; 


sli] = sj]; s[j] = c; 


} 
} 
HERU PAE SIH Re SRNT, POMS AES, oP 
ee 这 些 喜 号 并 不 保证 各 表达 式 按 从 左 至 右 的 顺 
> 


MIZE SIZ A eH SIZE RAT KARAS NAS, bea 
EHAS reverse ER KUNNI for 语句 ， 对 于 需要 在 单个 表达 式 中 进行 多 步 
计算 的 宏 来 说 也 很 适合 。 喜 号 表达 式 还 适用 于 reverse 函数 中 元 素 的 
交换 ， 这 样 ， a 才 程 便 可 以 看 成 是 一 个 单 步 操 作 。 


for (i = 0, j = strlen(s)*1; i < j; i++, jee) c = s[i], sli] = s[j], s[j] = c; 


练习 3°3 编写 函数 expand(s1, s2)， 将 字符 串 s1 中 类 似 于 arz 一 
类 的 速记 符号 


在 字符 串 s2 中 扩展 为 等 价 的 完整 列表 abc...xyz。 该 函数 可 以 处 理 大 小 
写字 母 和 数字 ， 并 可 以 处 理 asb*c、asz0*。9 与 asz 等 类 似 的 情况 。 作 为 
前 导 和 尾随 的 .字符 原样 排 印 。 


3.6 doewhile 盾 不 


我 们 在 第 1 章 中 曾经 讲 过 ，while 与 for 这 两 种 循环 在 循环 体 执行 前 对 
终止 条 件 进 行 测 试 。 与 此 相反 ，C 语言 中 的 第 三 种 循环 一 一 do*while 
循环 则 在 循环 体 执行 后 测试 终止 条 件 ， 这样 循 环 体 至 少 被 执行 一 次 。 


do*while 循环 的 语法 形式 如 下 : 
do 

语句 

while (表达 式 ); 


在 这 一 结构 中 ， 先 执行 循环 体 中 的 语句 部 分 ， 然 后 再 求 表 达 式 的 值 。 
如 果 表 达 式 的 值 为 真 ， 则 再 次 执行 语句 ， 依 此 类 推 。 当 表达 式 的 值 变 
为 假 ， 则 循环 终止 。 除 了 条 件 测试 的 语义 不 同 外 ，do*while 循环 与 


Pascal 语言 的 repeateuntil 语句 等 价 。 


经 验 表 明 ，do*while 循环 比 while 循环 和 for 循环 用 得 少 得 多 。 尽 管 如 
此 ，do*while 循环 语句 有 时 还 是 很 有 用 的 ， 下 面 我 们 通过 函数 itoa 来 
说 明 这 一 点 。itoa 函数 是 atoi K 数 的 揽 函 数 ， 它 把 数字 转换 为 字符 
串 。 这 个 工作 比 最 初 想像 的 要 复杂 一 些 。 如 果 按 照 atoi 函数 中 生成 数 
字 的 方法 将 数字 转换 为 字符 串 ， 则 生成 的 字符 串 的 次 序 正 好 是 颠倒 
的 ， 因 此 ， 我 们 首先 要 生成 反 序 的 字符 串 ， 然 后 再 把 该 字符 串 倒置 。 


/* itoa: convert n to characters in s */ void itoa(int n, char s[]) 


{ 
int i, sign; 


if ((sign = n) < 0) /* record sign */ 


n = en; /* make n positive */ i = 0; 


do { /* generate digits in reverse order */ s[it+] =n % 10 + 
'0'; /* get next digit */ 

} while ((n /= 10) > 0); /* delete it */ if (sign < 0) 
setae, 


s[i] = '\0'; reverse(s); 
} 


这 里 有 必要 使 用 doewhile 语句 ， 至 少 使 用 doewhile 语句 会 方便 一 些 ， 
因为 即使 n 的 值 为 0， 也 至 少 要 把 一 个 字符 放 到 数组 s 中 。 其 中 的 
do*while 语句 体 中 只 有 一 条 语句 ， 尺 管 没 有 必要 ， 但 我 们 仍然 用 花 括 
号 将 该 语句 括 起 来 了 ， 这 样 做 可 以 避免 草率 的 读者 将 while 部 分 误 认 
HERA while 循环 的 开始 。 

练习 3.4 “在 数 的 对 二 的 补 码 表示 中 ， 我 们 编写 的 itoa 函数 不 能 处 理 


最 大 的 负数 ， 即 n 等 于 .2* “的 情况 。 请 解释 其 原因 。 修 改 该 画 数 ， 
使 它 在 任何 机 器 上 运行 时 都 能 打印 出 正确 的 值 。 


练习 305 编写 函数 itob(n, s, b), REZI n 转换 为 以 b AEN 
数 ， 并 将 转换 结果 


DFAT URE TTR sH o HIG, itob(n, s, 16) 把 整数 n 格式 化 
成 十 六 进 制 整数 保存 在 s 中 。 


练习 3.6 修改 itoa 画 数 ， 使 得 该 丽 数 可 以 接收 三 个 参数 。 其 中 ， 第 三 
个 参数 为 最 小 字段 宽度 。 为 了 保证 转换 后 所 得 的 结果 至 少 具有 第 三 个 
参数 指定 的 最 小 宽度 ， 在 必要 时 应 在 所 得 结果 的 左边 填充 一 定 的 空 


3.7 break 语 旬 与 continue 24) 


不 通过 循环 头 部 或 尾部 的 条 件 测 试 而 跳出 循环 ， 有 时 是 很 方便 的 。 
break 语句 可 用 于 从 for、while 与 doewhile 等 循环 中 提前 退出 ， 束 如 同 
从 switch 语句 中 提前 退出 一 样 。break 语句 能 使 程序 从 switch 语句 或 
最 内 层 循环 中 立即 跳出 。 


下 面 的 函数 trim 用 于 删除 字符 串 尾部 的 空格 人 特 、 制 表 符 与 换行 从 。 当 
发 现 最 右边 的 字符 为 非 空 格 符 、 非 制 表 符 、 非 换行 符 时 ， 束 使 用 
break 语句 从 循环 中 退出 。 


/* trim: remove trailing blanks, tabs, newlines */ int trim(char s[]) 
{ 

int n; 

for (n = strlen(s)*1; n >= 0; nee) 

if (s[n] !='' && s[n] != \t' && s[n] != ^n’ break; 

s[n+1] = '\0'; 

return n; 

} 


strlen 芳 数 返回 字符 串 的 长 度 。for TEER FEB AAR ETT ARA TTS 
描 寻 找 第 一 个 不 是 空格 符 、 制 表 符 以 及 换行 符 的 字符 。 当 找到 符合 条 


件 的 第 一 个 字符 ， 或 当 循环 控制 变量 n 变 为 负数 时 ( 即 整个 字符 串 都 被 
扫描 完 时 )， 循 环 终止 执行 。 读 者 可 以 验证 ， 即 使 字符 串 为 至 或 仅 包 
含 空 日 答 ， 该 男 数 也 有 古 正确 的 。 


continue 语句 与 break 语句 是 相关 联 的 ， 但 它 没 有 break 语句 常用 。 
continue i 句 用 于 使 for、while 或 doewhile 语句 开始 下 一 次 循环 的 执 
行 。 在 while 与 doewhile 语句 中 ，continue 语句 的 执行 意味 着 立即 执行 
测试 部 分 ;在 for 循环 中 ， 则 意味 着 使 控制 转移 到 递增 循环 变量 部 分 。 
continue 语句 只 用 于 循环 语句 ， 不 用 于 switch 语句 。 某 个 循 环 包 含 的 
switch 语句 中 的 continue 语句 ， 将 导致 进入 下 一 次 循环 。 


例如 ， 下 面 这 段 程序 用 于 处 理 数 组 a 中 的 非 负 元 素 。 如 果 某 个 元 素 的 
ENR, WUE AN 处 理 。 


for (i = 0; i < n; i++) 


if (ali] < 0) /* skip negative elements */ continue; 
... /* do positive elements */ 


4 BAW a BB op Lees SREY, A A SA] continue 语句 。 这 种 情况 
下 ， 如 果 不 使 用 continue 1845), JB) Beas APE MU UB ee a 
男 一 层 循环 ， 这 样 做 会 使 程序 的 区 套 更 深 。 


3.8 goto 语 旬 与 标号 


C 语言 提供 了 可 随意 滥用 的 goto 语句 以 及 标记 跳 转 位 置 的 标号 。 从 理 
WEH, goto 语 句 是 没有 必要 的 ， 实 践 中 不 使 用 goto 语句 也 可 以 很 
容易 地 写 出 代码 。 至 此 ， 本 书 中 还 没有 使 用 goto 语句 。 


但 是 ， 在 某 些 场合 下 goto 语句 还 是 用 得 着 的 。 最 前 见 的 用 法 是 终止 程 
PRES ER ERE 的 结构 中 的 处 理 过 程 ， 例 如 一 次 跳出 两 层 或 多 层 循 
环 。 这 种 情况 下 使 用 break 语句 是 不 能 达到 目的 的 ， 它 只 能 从 最 内 层 
循环 退出 到 上 一 级 的 循环 。 下面 是 使 用 goto 语句 的 一 个 例子 : 


for (... ) 


for (...) { 


if (disaster) goto error; 


} 


error: 


/* clean up the mess */ 


在 该 例子 中 ， 如 采 错 误 处 理 代码 很 重要 ， 并 且 错 误 可 能 出 现在 多 个 地 
方 ， 使 用 goto 语句 将 会 比较 方便 。 


标号 的 命名 同 变量 命名 的 形式 相同 ， 标 号 的 后 面 要 紧 跟 一 个 冒号 。 标 
号 可 以 位 于 对 应 的 


goto 语句 所 在 函数 的 任何 语句 的 前 面 。 标 号 的 作用 域 定 整个 函数 。 


我 们 来 看 另外 一 个 例子 。 考 虑 判定 两 个 数组 a 与 b 中 征 否 具有 相同 元 
素 的 问题 。 一 种 可 能 的 解决 方法 是 : 


for (i = 0; i < n; i++) for (j = 0; j < m; j++) 
if (ali] == b[j]) goto found; 


/* didn't find any common element */ 


found: 


/* got one: ali] == b[j] */ 


所 有 使 用 了 goto 语句 的 程序 代码 都 能 改写 成 不 市 goto 语句 的 程序 ， 
但 可 能 会 增加 一 些 额外 的 重复 测试 或 变量 。 例 如 ， 可 将 上 面 判定 是 否 
具有 相同 数组 元 素 的 程序 段 改写 成 下 列 形 式 : 


found = 0; 


for (i = 0; i < n && !found; i++) for (j = 0; j < m && !found; j++) 
if (aLi] == b[j]) found = 1; 
if (found) 


/* got one: a[ie1] == b[je1] */ 


else 


/* didn't find any common element */ 


大 多 数 情况 下 ， 使 用 goto 语句 的 程序 段 比 不 使 用 goto 语句 的 程序 段 
要 难以 理解 和 维护 ， 少数 情况 除外 ， 比 如 我 们 前 面 所 举 的 几 个 例子 。 
尽管 该 问题 并 不 太 产 重 ， 但 我 们 还 是 建议 尽 可 能 少 地 使 用 goto 语句 。 


第 4 章 函数 与 程序 结构 


玉 数 可 以 把 大 的 计算 任务 分 解 成 阁 干 个 较 小 的 任务 ， 程 序 设计 人 人 员 可 
以 基于 函数 进一步 构造 程序 ， 而 不 需要 重新 编写 一 些 代码 。 一 个 设计 
得 当 的 函数 可 以 把 程序 中 不 需要 了 解 的 具 体操 作 细 广 隐 着 起 来 ， 从 而 
使 整个 程序 结构 更 加 清晰 ， 并 降低 修改 程序 的 难度 。 


C 语言 在 设计 中 考虑 了 函数 的 高 效 性 与 易 用 性 这 两 个 因素 。C 语言 程 
序 一 般 都 由 许多 小 的 钞 数 组 成 ， 而 不 是 由 少量 较 大 的 函数 组 成 。 一 个 
程序 可 以 保存 在 一 个 或 者 多 个 源 文件 中 。 各 个 文件 可 以 单独 编译 ， 并 
可 以 与 库 中 已 编译 过 的 函数 一 起 加 载 。 我 们 在 这 里 不 打算 详细 讨论 这 
一 过 程 ， 因 为 编译 与 加 载 的 具体 实现 细节 在 各 个 编译 系统 中 并 不 相 


H 


ANSI 标准 对 C HE S PTAS SPH T AAE K SERIE SO 
方面 。 第 1 章 中 我 们 曾经 讲 过 ， 目 前 C 语言 已 经 允许 在 声明 函数 时 声 
明 参 数 的 类 型 。 为 了 使 画 数 的 声明 与 定义 相 适应 ，ANSI 标准 对 函数 
定义 的 语法 也 做 了 修改 。 基 于 该 原因 ， 编 译 紫 束 有 可 能 检测 出 比 以 前 
的 C 语言 版 本 更 多 的 错误 。 并 且 ， 如 果 参 数 声 明 得 当 ， 程 序 可 以 目 动 
地 进行 适当 的 强制 类 型 转换 。 


ANSI 标准 进一步 明确 了 名 字 的 作用 域 规 则 ， 特 别 要 求 每 个 外 部 对 象 
只 能 有 一 个 定义 。 初 始 化 的 适用 范围 也 更 加 广泛 了 ， 目 动 数组 与 结构 
都 可 以 进行 初始 化 。 


C 语言 预 处 理 的 功能 也 得 到 了 增强 。 新 的 预 处 理事 包含 一 组 更 完整 的 
条 件 编译 指令 (一 种 通过 宏 参 数 创 建 市 引号 的 字符 串 的 方法 )， 对 宏 扩 
展 过 程 的 控制 更 严格 。 


4.1 函数 的 基本 知识 
首先 我 们 来 设计 并 编写 一 个 程序 ， 它 将 输入 中 包含 特定 "模式 "或 字符 


串 的 各 行 打印 出 来 (这 是 UNIX 程序 grep 的 特例 ) 例 如 ， 在 下 列 一 组 文 
本 行 中 碍 找 包含 字符 串 * ould" 的 行 : 


Ah Love! could you and I with Fate conspire To grasp this sorry Scheme of 
Things entire, Would not we shatter it to bits *«* and then Resmould it nearer 
to the Heart's Desire! 


程序 执行 后 输出 下 列 结果 : 


Ah Love! could you and I with Fate conspire Would not we shatter it to bits 
ee and then Resmould it nearer to the Heart's Desire! 


该 任务 可 以 明确 地 划分 成 下 列 3 部 分 : 

whiel (还 有 未 处 理 的 行 ) 

if (该 行 包含 指定 的 模式 ) 

打印 该 行 

尽管 我 们 可 以 把 所 有 的 代码 都 放 在 主 程序 main 中 ， 但 更 好 的 做 法 是 ， 


利用 其 结构 把 每 一 部 分 设计 成 一 个 独立 的 函数 。 分 别处 理 3 个 小 的 部 
分 比 处 理 一 个 大 的 整体 更 容易 ， 因 为 这 样 


By DAZE ASR AY ZA RER, MRD TAN BEA A ERS 
HWZ, HE, REKA 也 可 以 在 其 它 程序 中 使 用 。 


我 们 用 函数 getline 实现 "还 有 未 处 理 的 行 "， 该 函数 已 在 第 1 章 中 介绍 
过 ;用 printf 函数 实现 "打印 该 行 "， 这 个 函数 是 现成 的 ， 别 人 已 经 提供 
了 。 也 束 是 说 ， 我 们 只 需要 编写 一 个 判定 "该 行 包含 指定 的 模式 "的 函 
BL ° 


我 们 编写 函数 strindex(s, D 实 现 该 目标 。 该 函数 返回 字符 串 1{ 在 字符 串 
s 中 出 现 的 起 始 位 置 或 索引 。 当 s PEE tH, REEN. ° BFC 
语言 数组 的 下 标 从 0 开始， 下 标的 值 只 可 能 为 0 或 正 数 ， 因 此 可 以 用 
Rol 这 样 的 负数 表示 失败 的 情况 。 如 果 以 后 需要 进行 更 复 杂 的 模式 匹 
Bc, Rae strindex 函数 即 可 ， 程 序 的 其 余部 分 可 保持 不 变 。( 标 准 
库 中 提供 的 库 函 数 strstr 的 功能 类 似 于 strindex 函数 ， 但 该 库 函 数 返 回 
的 是 指针 而 不 是 下 标 值 。) 


完成 这 样 的 设计 后 ， 编 写 整个 程序 的 细 廊 就 直截了当 了 。 下 面 列 出 的 
忠 古 一 个 完整 的 程序 ， 读 者 可 以 查看 各 部 分 是 怎样 组 合 在 一 起 的 。 我 
们 现在 查找 的 模式 是 子 符 串 字 面值 ， 它 不 十 一 种 最 通用 的 机 制 。 我 们 
在 这 里 只 简单 讨论 字符 数组 的 初始 化 方法 ， 第 5 章 将 介绍 如 何在 程序 
运行 时 将 模式 作为 参数 传递 给 函数 。 其 中 ，getline 函数 较 前 面 的 版 本 
N 读者 可 将 它 与 第 1 章 中 的 版 本 进行 比较 ， 或 许 会 得 到 一 


#include <stdio.h> 


#define MAXLINE 1000 /* maximum input line length */ 
int getline(char line[], int max) 

int strindex(char source[], char searchfor[]); 

char pattern[] = "ould"; /* pattern to search for */ 
/* find all lines matching pattern */ main() 


{ 


char line[MAXLINE]; int found = 0; 

while (getline(line, MAXLINE) > 0) 

if (strindex(line, pattern) >= 0) { printf("%s", line); 
found++; 

} 

return found; 


} 


/* getline: get line into s, return length */ int getline(char s[], int 
lim) 


while (im > 0 && (c=getchar()) != EOF && c != ‘\n’) sli++] = c; 
if (c == '\n’) 
sli++] = c; s[i] = ^\0'; return i; 


} 


/* strindex: return index of t in s, °1 if none */ int strindex(char s[], 
char t[]) 


{ 
int i, j, k; 
for (i = 0; s[i] != \0'; i++) { 


for =i, k=0; t[k]!=^\0' && s[j]==t[k]; j++, k++) 


if (k > 0 && t[k] == '\0') return i; 
} 


return °1; 


} 
函数 的 定义 形式 如 下 : 
返回 值 类 型 函数 明 ( 参 数 声 明 表 ) 


{ 

声明 和 语句 

} 

函数 定义 中 的 各 构成 部 分 都 可 以 省 略 。 最 简单 的 钞 数 如 下 所 示 : 
dummy() {} 


该 男 数 不 执行 任何 操作 也 不 返回 任何 值 。 这 种 不 执行 任何 操作 的 函数 
有 时 很 有 用 ， 它 可 以 在 程序 开发 期 间 用 以 保留 位 置 (留待 以 后 填充 代 
码 )。 如 采 函 数 定义 中 省 略 了 返回 值 类 型 ， 则 默 认为 int 类 型 。 


程序 可 以 看 成 是 变量 定义 和 函数 定义 的 集 台 。 函数 之 则 的 通信 可 以 通 
WER > BORE) 值 以 及 外 部 变量 进行 。 函 数 在 源 文 件 中 出 现 的 次 序 
可 以 是 任 意 的 。 只 要 保证 每 一 个 函数 不 被 分 离 到 多 个 文件 中 ， 源 程序 
忠 可 以 分 成 多 个 文件 。 


被 调用 函数 通过 return 语句 同调 用 者 返回 值 ，return 语句 的 后 面 可 以 跟 
任何 表达 式 : 


return 表达 式 ; 在 必要 时 ， 表 达 式 将 被 转 换 为 函数 的 返回 值 类 型 。 表 达 
式 两 边 通常 加 一 对 圆 括号 ， 此 处 的 括 


号 是 可 选 的 。 


调用 函数 可 以 忽略 返回 值 。 并 且 ，return 语句 的 后 面 也 不 一 定 需 要 表 
达 式 。 当 return 语句 的 后 面 没 有 表达 式 时 ， 画 数 将 不 同调 用 者 返回 

值 。 当 说 调用 函数 执行 到 最 后 的 右 伦 括 号 而 结束 执行 时 ， 控 制 同样 也 
会 返回 给 调用 者 (不 返回 值 )。 如 采 某 个 函数 从 一 个 地 方 返回 时 有 返回 
值 ， 而 从 男 一 个 地 方 返 回 时 没有 返回 值 ， 该 函 数 并 不 非法 ， 但 可 能 是 
一 种 出 问题 的 征兆 。 在 任何 情况 下 ， 如 采 函 数 没有 成 功 地 返回 一 个 
值 ， 则 它 的 " 值 "肯定 古 无 用 的 。 


在 上 面 的 模式 查找 程序 中 ， 主 程序 main 返回 了 一 个 状态 ， 即 匹配 的 数 
目 。 该 返回 值 可 以 在 调用 该 程序 的 环境 中 使 用 。 


在 不 同 的 系统 中 ， 保 存在 多 个 源 义 件 中 的 C 语言 程序 的 编译 与 加 载 机 
制 是 不 同 的 。 例 如 ， 在 UNIX 系统 中 ， 可 以 使 用 第 1 章 中 提 到 过 的 cc 
命令 执行 这 一 任务 。 假 定 有 3 个 函数 分 别 存 放 在 名 为 main.c、 
getline.c 与 strindex.c 的 3 个 文件 中 ， 则 可 以 使 用 命令 


cc main.c getline.c strindex.c 


来 编译 这 3 个 文件 ， 并 把 生成 的 目标 代码 分 别 存 放 在 文件 main.o 


` getline.o 与 


strindex.o 中 ， 然 后 再 把 这 3 个 文件 一 起 加 载 到 可 执行 文件 aout 中 。 
AAU ETF 中 存在 错误 (比如 文件 main.c 中 存在 错误 )， 则 可 以 通过 命 


今 


cc main.c getline.o strindex.o 


对 main.c 文件 重新 编译 ， 并 将 编译 的 结果 与 以 前 已 编译 过 的 目标 文件 
getline.o 和 strindex.o 一 起 加 载 到 可 执行 文件 中 。cc 命令 使 用 “.c" 与 “ 
.0" 这 两 种 扩展 名 来 区 分 源 文件 与 目标 文件 。 


练习 4e1 i ERAN strindex(s, t)， 它 返回 字符 串 t 在 s 中 最 右边 
出 现 的 位 置 。 WR s 中 不 包含 t， 则 返回 .1。 


4.2 返回 非 整 型 值 的 函数 


到 目前 为 目 ， 我 们 所 讨论 的 函数 都 是 不 返回 任何 值 (void) 或 只 返回 int 
类 型 值 的 函数 。 假如 某 个 函数 必须 返回 其 它 类 型 的 值 ， 该 怎么 办 了 昵 ? 
许多 数值 济 数 (如 sqrt、sin 与 cos KÄORE double 类 型 的 
值 ， 某 些 专用 本 数 则 返回 其 它 类 型 的 值 。 我 们 通过 函数 atof(s) 来 说 明 
函数 返回 非 整 型 值 的 方法 。 该 函数 把 字符 串 s 转换 为 相应 的 双 精 度 浮 
点 数 。 atof 函数 是 atoi 函数 的 扩展 ， 第 2 草 与 第 3 BONIS atoi K 
数 的 几 个 版 本 。atof ER 数 需要 处 理 可 选 的 符号 和 小 数 点 ， 并 要 考虑 可 
能 缺少 整数 部 分 或 小 数 部 分 的 情况 。 我 们 这 里 编写 的 版 本 并 不 是 一 个 
高 质量 的 输入 转换 函数 ， 它 占用 了 过 多 的 空间 。 标 准 库 中 包含 类 似 功 
能 的 atof 函数 ， 在 头 文件 <stdlib.h> 中 声明 。 


首先 ， 由 于 atof 函数 的 返回 值 类 型 不 是 int， 因 此 该 函数 必须 声明 返回 
值 的 类 型 。 返 回 值 的 类 型 名 应 放 在 函数 名 字 之 前 ， 如 下 所 未: 


#include <ctype.h> 


/* atof: convert string s to double */ double atof(char s[]) 


{ 


double val, power; int i, sign; 


for (i = 0; isspace(s[i]); i++) /* skip white space */ 
sign = (s[i] == '*') ? °1 : 1; 

if (s[i] == '+' || s[i] == '*') i++; 

for (val = 0.0; isdigit(s[i]); i++) val = 10.0 * val + (s[i] ° '0'); 
if (s[i] == '.') i++; 

for (power = 1.0; isdigit(s[i]); i++) { 

val = 10.0 * val + (s[i] * '0'); power *= 10; 

} 

return sign * val / power; 

} 

其 次 ， 调 用 函数 必须 知道 atof 函数 返回 的 是 非 整 型 值 ， 这 一 点 也 是 很 


重要 的 。 为 了 达到 该 目的 ， 一 种 方法 是 在 调用 函数 中 显 式 声 明 atof 图 
数 。 下 面 所 示 的 基本 计算 器 程序 ( 仅 适 用 


TARER) PB Ho ARETE TT E A CGY Bl BI 
面 可 能 有 正 负 号 )， 并 对 它们 求 和 ， 在 每 次 输入 完成 后 把 这 些 数 的 至 
计 总 和 打印 出 来 : 


#include <stdio.h> 


#define MAXLINE 100 

/* rudimentary calculator */ main() 

{ 

double sum, atof(char []); char line[MAXLINE]; 

int getline(char line[], int max); 

sum = 0; 

while (getline(line, MAXLINE) > 0) printf("\t%g\n", sum += atof(line)); 


return 0; 


~ 


Et, EIA 
double sum, atof(char []); 


表明 sum 是 一 个 double 类 型 的 变量 ，atof 函数 带 有 个 char[] 类 型 的 参 
数 ， 且 返回 一 个 double 类 型 的 值 。 


函数 atof 的 声明 与 定义 必须 一 致 。 如 果 atof 函数 与 调用 它 的 主 函 数 
main 放 在 同一 源 SCE, FF A RAN a, See RS BAS 
误 。 但 是 ， 如 果 atof 函数 是 单独 编译 的 (这 种 可 能 性 更 大 )， 这 种 不 匹 
配 的 错误 就 无 法 检测 出 来 ，atof 函数 将 返回 double 类 型 的 值 ， 而 main 
函数 却 将 返回 值 按照 int 类 型 处 理 ， 最 后 的 结果 值 室 无 意义 。 


Ae HU THK EW OE A a] Se BU, ACES cB 
象 似乎 很 令 人 吃惊 。 PAM, WRA KURE, MEK 
将 在 第 一 次 出 现 的 表达 式 中 被 隐 式 声明 ， 例 如 : 


sum += atof(line) 


如 果 先 前 没有 声明 过 的 一 个 名 字 出 现在 某 个 表达 式 中 ， 并 且 其 后 紧 跟 
一 个 左 圆 括号 ， 那 么 上 FARUNA TENKA, AAN 
的 返回 值 将 被 假定 为 int 类 型 ， 但 上 下 文 并 不 对 其 参数 作 任何 假设 。 
并 且 ， 如 有 果 函 数 声 明 中 不 包含 参数 ， 例 如 : 


double atof(); 


那么 编译 程序 也 不 会 对 函数 atof 的 参数 作 任 何 假设 ， 并 会 关闭 所 有 的 
参数 检查 。 对 空 参数 表 的 这 种 特殊 处 理 是 为 了 使 新 的 编译 舌 能 编译 比 
较 老 的 C 语言 程序 。 不 过 ， 在 新 编写 的 程序 中 这 么 做 是 不 提倡 的 。 如 
人 


在 正确 进行 声明 的 函数 atof 的 基础 上 ， 我 们 可 以 利用 它 编 写 出 函数 
atoi H FIRE 换 为 int 类 型 ): 


/* atoi: convert string s to integer using atof */ int atoi(char s[]) 
{ 
double atof(char s[]); 


return (int) atof(s); 

} 

请 注意 其 中 的 声明 和 retum 语句 的 结构 。 在 下 列 形 式 的 return 语句 中 : 
return( 表 达 式 ); 


其 中 ， 表 达 式 的 值 在 返回 之 前 将 被 转换 为 函数 的 类 型 。 因 为 函数 atoi 
的 返回 值 为 int 类型， 所以，retur 语句 中 的 atof 函数 的 double 类 型 
值 将 被 目 动 转换 为 int 类 型 值 。 但 是 ， 这 种 操作 可 能 会 丢失 信息 ， 某 
些 编译 姻 可 能 会 对 此 给 出 警告 信息 。 在 该 画 数 中 ， 由 于 采用 了 类 型 转 
痪 的 万 法 显 式 表 明了 所 要 执行 的 转换 操作 ， 因此 可 以 防止 有 关 的 警告 


AUD © 


练习 492 对 atof 函数 进行 扩充 ， 使 它 可 以 处 理 形 如 
123.45e*6 


的 科学 表示 法 ， 其 中 ， 浮 点 数 后 面 可 能 会 紧 跟 一 个 e 或 E 以 及 一 个 指 
数 ( 可 能 有 正 仙 号 )。 


4.3 外 部 变量 


C 语言 程序 可 以 看 成 由 一 系列 的 外 部 对 象 构成 ， 这 些 外 部 对 象 可 能 是 
变量 或 函数 。 形 容 词 external 与 internal 相对 的 ，internal 用 于 描述 定 
义 在 函数 内 部 的 函数 参数 及 变量 。 外 部 变量 定 义 在 函数 之 外 ， 因 此 可 
以 在 许多 函数 中 使 用 。 由 于 C 语言 不 允许 在 一 个 函数 中 定义 其 它 男 
数 ， 因此 画 数 本 身 是 "外 部 的 "'。 默 认 情 况 下 ， 外 部 变量 与 函数 具有 下 
列 性 质 :通过 同一 个 名 字 对 外 部 变量 的 所 有 引用 (即使 这 种 引用 来 自 于 
单独 编译 的 不 同 函 数 ) 实 际 上 都 是 引用 同一 个 对 象 (标准 中 把 这 一 性 质 
称 为 外 部 链接 )。 在 这 个 意义 上 ， 外 部 变量 类 似 于 Fortran 语言 的 
COMMON 块 或 Pascal 语言 中 在 最 外 层 程 序 块 中 声明 的 变量 。 我 们 将 
在 后 面 介 绍 如 何 定 义 只 能 在 某 一 个 源 文 件 中 使 用 的 外 部 变量 与 函数 。 


因为 外 部 变量 可 以 在 全 局 范围 内 访问 ， 这 就 为 画 数 之 间 的 数据 交换 提 
供 了 一 种 可 以 代替 函数 参数 与 返回 值 的 方式 。 任 何 函 数 都 可 以 通过 名 


字 访 问 一 个 外 部 变量 ， 当 然 这 个 名 字 需 要 通过 茶 种 方式 进行 声明 。 


如 果 函 数 之 间 需 要 其 至 大 量 的 变量 ， 使 用 外 部 变量 要 比 使 用 一 个 很 长 
的 参数 表 更 方便 、 有效 。 但 是 ， 我 们 在 第 1 章 中 已 经 指出 ， 这 样 做 必 
须 非常 谍 慎 ， 因 为 这 种 方式 可 能 对 程序 结 构 产 生 不 民 的 影响 ， 而 且 可 
能 会 导致 程序 中 各 个 函数 之 间 具 有 太 多 的 数据 联系 。 


外 部 变量 的 用 途 还 表现 在 它们 与 内 部 变量 相 比 具有 更 大 的 作用 域 和 更 
长 的 生存 期 。 目 动 变量 只 能 在 函数 内 部 使 用 ， 从 其 所 在 的 函数 被 调用 
时 变量 开始 存在 ， 在 函数 退出 时 变量 也 将 消失 。 而 外 部 变量 是 永久 存 
在 的 ， 它 们 的 值 在 一 次 函数 调用 到 下 一 次 函数 调用 之 间 保 持 不 变 。 A 
E, QAR PN TER BU HE EET, TIA SERA AB al HTT , 
这 种 情况 下 最 方便 的 AAE eI ES EE MS Be, TS 
征 作为 函数 参数 传递 


下 面 我 们 通过 一 个 更 复杂 的 例子 来 说 明 这 一 点 。 我 们 的 目标 是 编写 一 
个 具有 加 (+)、 减 (-)、 乘 (*)、 除 (/) 四 则 运算 功能 的 计算 器 程序 。 为 了 
更 容易 实现 ， 我 们 在 计算 絮 中 使 用 逆 波 兰 表 示 法 代替 普通 的 中 辍 表 示 
法 ( 逆 波 兰 表 示 法 用 在 某 些 袖珍 计算 器 中 ，Forth 与 Postscript 等 语言 也 
使 用 了 逆 波 兰 表示 法 )。 


在 逆 波 兰 表示 法 中 ， 所 有 运算 符 都 跟 在 操作 数 的 后 面 。 比 如 ， 下 列 中 


级 表达 式 : 


(1-2) *(4+5) 

采用 逆 波 兰 表示 法 表示 为 : 

12°45+* 

送 波 兰 表示 法 中 不 需要 圆 括号 ， 只 要 知道 每 个 运算 符 需 要 几 个 操作 数 
就 不 会 引起 歧义 。 计算 絮 程序 的 实现 很 简单 。 每 个 操作 数 都 被 依次 压 
入 到 校 中 ; 当 一 个 运算 和 从 到达 时 ， 从 


校 中 弹出 相应 数目 的 操作 数 (对 二 元 运算 符 来 说 是 两 个 操作 数 )， 把 该 
运算 符 作 用 于 弹出 的 操 


作 数 ， 并 把 运算 结果 再 压 入 到 校 中 。 例 如 ， 对 上 面 的 逆 波 兰 表 达 式 来 
说 ， 首 先 把 1 和 2 压 入 

到 校 中 ， 再 用 两 者 之 差 "1 取代 它们 ;然后 ， 将 4 和 5 压 入 到 校 中 ， 再 用 
两 者 之 和 9 取代 它们 。 最 后 ， 从 校 中 取出 校 顶 的 ,1 和 9， 并 把 它们 的 
积 9 压 入 到 校 顶 。 到 达 输 入 行 的 末尾 时 ， 把 校 顶 的 值 弹 出 并 打印 。 


这 样 ， 该 程序 的 结构 束 构 成 一 个 循环 ， 每 次 循环 对 一 个 运算 符 及 相应 
的 操作 数 执行 一 次 BRIE: 


while (下 一 个 运算 符 或 操作 数 不 是 文件 结束 指示 符 ) if (是 数 ) 
将 该 数 压 入 到 找 中 

else if (是 运算 符 ) 

弹出 所 需 数目 的 操作 数 

执行 运算 

将 结果 压 入 到 找 中 

else if (是 换行 符 ) 


弹出 并 打印 找 顶 的 值 


else 
出 错 


校 的 压 入 与 弹出 操作 比较 简单 ， 但 是 ， 如 果 把 错误 检测 与 恢复 操作 都 
加 进来 ， 该 程序 束 显得 很 长 了 ， 最 好 把 它们 设计 成 独立 的 函数 ， 而 不 
要 把 它们 作为 程序 中 重复 的 代码 段 使 用 。 夯 外 还 需要 一 个 单独 的 函数 
来 取 下 一 个 输入 运算 符 或 操作 数 。 


到 目前 为 止 ， 我们 还 没有 讨论 设计 中 的 一 个 重要 问题 :把 校 放 在 哪儿 ? 
也 就 是 说 ， 哪 些 例 程 可 以 直接 访问 它 ? 一 种 可 能 是 把 它 放 在 主 函 数 
main 中 ， 把 校 及 其 当前 位 置 作为 参数 传递 给 对 它 执 行 压 入 或 弹出 操作 
的 函数 。 但 是 ，main 函数 不 需要 了 解 控制 校 的 变量 信息 ， 它 只 进行 压 
入 与 弹出 操作 。 因 此 ， 可 以 把 校 及 相关 信息 放 在 外 部 变量 中 ， 并 只 供 
push 与 pop 函数 访问 ， 而 不 能 被 main 函数 访问 。 


把 上 面 这 段 话 转换 成 代码 很 容易 。 如 采 把 该 程序 放 在 一 个 源 文 件 中 ， 
程序 可 能 类 似 于 下 列 形式 : 


#include... fe — EO SLE */ 
#define... /* —6 define 定义 */ 
main 使 用 的 函数 声明 

main() {... } 


push 与 pop 所 使 用 的 外 部 变量 
void push( double f) { ... } 
double pop(void) { ... } 


int getop(char s[]) { ... } 


被 getop 调用 的 函数 
我 们 在 后 面部 分 将 讨论 如 何 把 该 程序 分 割 成 两 个 或 多 个 源 文 件 。 


main 函数 包括 一 个 很 大 的 switch 循环 ， 该 循环 根据 运算 符 或 操作 数 的 
类 型 控制 程序 的 转移 。 这 里 的 switch 语句 的 用 法 比 3.4 节 中 的 例子 更 


为 典型 。 


#include <stdio.h> 


#include <stdlib.h> /* for atof() */ 
#define MAXOP 100 /* max size of operand or operator */ 
#define NUMBER '0' /* signal that a number was found */ 


int getop(char []); void push(double); double pop(void); 
/* reverse Polish calculator */ main() 

{ 

int type; double op2; char ss;MAXOP]; 

while ((type = getop(s)) != EOF) { switch (type) { 
case NUMBER: push(atof(s)); break; 

case '+': 

push(pop() + pop()); break; 

case *" 

push(pop() * pop()); break; 

case '*': 


op2 = pop(); push(pop() * op2); break; 


case '/': 

op2 = pop(); 

if (op2 != 0.0) 

push(pop() / op2); else 

printf("error: zero divisor\n"); break; 
case \n 

printf("\t%.8g\n"", pop()); break; 
default: 

printf("error: unknown command %s\n", s); break; 
} 

} 

return 0; 

} 


因为 + 与 * 两 个 运算 符 满 足 交 换 律 ， 因 此 ， 操 作 数 的 弹出 次 序 无 天 紧 
要 。 但 是 ，* 与 /两 个 


运算 和 从 的 左右 探 作 数 必须 加 以 区 分 。 在 函数 调用 
push(pop() * popO); /* WRONG */ 


中 并 没有 定义 两 个 pop 调用 的 求 值 次 序 。 为 了 保证 正确 的 次 序 ， 必 须 
像 main 函数 中 一 样 把 第 一 个 值 弹 出 到 一 个 临时 变量 中 。 


#define MAXVAL 100 /* maximum depth of val stack */ 


int sp = 0; /* next free stack position */ double 
val[MAX VAL]; /* value stack */ 


/* push: push f onto value stack */ void push(double f) 
{ 

if (sp < MAXVAL) val[sp++] = f; 

else 

printf("error: stack full, can't push %g\n", f); 

} 

/* pop: pop and return top value from stack */ double pop(void) 
{ 

if (sp > 0) 

return val[*esp]; else { 

printf("error: stack empty\n"); return 0.0; 

} 

} 


如 采 变 量 定义 在 任何 函数 的 外 部 ， 则 十 外 部 变量 。 因 此 ， 我 们 把 push 
和 pop 函数 必须 共 至 的 校 和 校 项 指针 定义 在 这 两 个 画 数 的 外 部 。 但 
Æ, main 函数 本 身 并 没有 引用 校 或 校 顶 指 针 ， 因 此 ， 对 main 函数 而 
言 要 将 它们 隐藏 起 来 。 


下 面 我 们 来 看 getop 函数 的 实现 。 该 函数 获取 下 一 个 运算 符 或 操作 
数 。 该 任务 实现 起 来 比较 容易 。 它 需要 跳 过 空格 与 制 表 符 。 如 采 下 一 
个 字符 不 是 数字 或 小 数 点 ， 则 返回 ;否则 ， 把 这 些 数字 字符 串 收 集 起 来 
(其 中 可 能 包含 小 数 点 )， 并 返回 NUMBER， 以 标识 数 已 经 收集 起 来 
ave 


#include <ctype.h> 
int getch(void); void ungetch(int); 


/* getop: get next character or numeric operand */ int getop(char 


s[]) 

{ 

int i, c; 

while ((s[0] = c = getchO) == '' || c == \t) 
s[1] = '\0' 

if (lisdigit(c) && c !='.') 


return C; /* not a number */ i = 0; 


if (isdigit(c)) /* collect integer part */ while (isdigit(s[++i] = c = 
getch())) 


if (c ==". /* collect fraction part */ while (isdigit(s[++i] = c = 


getch())) 


s[i] = '‘\0'; if (c != EOF) 
ungetch(c); return NUMBER; 
} 


这 段 程序 中 的 getch 与 ungetch 两 个 函数 有 什么 用 途上 昵 ? 程 序 中 经 常会 
出 现 这 样 的 情况: 程序 不 能 确定 它 已 经 读 入 的 输入 是 否 足 够 ， 除 非 超前 
多 读 入 一 些 输入 。 读 入 一 些 字 符 以 合成 一 个 数字 的 情况 便 是 一 例 :在 看 
到 第 一 个 非 数 字 字 符 之 前 ， 已 经 读 入 的 数 的 完整 性 是 不 能 确定 的 。 由 
于 程序 要 超前 读 入 一 个 字符 ， 这 样 束 导致 最 后 有 一 个 字符 不 属于 当前 
所 要 读 入 的 数 。 


如 果 能 " 反 读 "不 需要 的 字符 ， 该 问题 束 可 以 得 到 人 解决。 每 当 程 序 多 读 
入 一 个 字符 时 ， 束 把 它 压 回 到 输入 中 ， 对 代码 其 余部 分 而 言 就 好 像 没 
有 读 入 该 字符 一 样 。 我 们 可 以 编写 一 对 互相 协作 的 函数 来 比较 方便 地 
模拟 反 取 字符 操作 。getch 函数 用 于 读 入 下 一 个 竺 处 理 的 字符 ， 而 
ungetch 函数 则 用 于 把 字符 放 回 到 输入 中 ， 这 样 ， 此 后 在 调用 getch K 
AY, FER AG 的 输入 之 前 先 返回 ungetch 函数 放 回 的 那个 字符 。 


这 两 个 画 数 之 间 的 协同 工作 也 很 简单 。ungetch 画 数 把 要 压 回 的 字符 放 
到 一 个 共享 缓冲 区 (字符 数组 ) 中 ， 当 该 缓冲 区 不 空 时 ，getch KARM 
缓冲 区 中 读 取 字符 ; 当 缓 冲 区 为 空 时 ，getch KAURA getchar 函数 直接 
从 输入 中 读 字 符 。 这 里 还 需要 增加 一 个 下 标 变量 来 记 住 缓冲 区 中 当前 
字符 的 位 置 。 


由 于 缓冲 区 与 下 标 变 量 是 供 getch 与 ungetch 函数 共享 的 ， 且 在 两 次 调 
用 之 间 必 须 保 持 值 不 变 ， 因 此 它们 必须 是 这 两 个 函数 的 外 部 变量 。 可 


以 按照 下 列 方式 编写 getch ` ungetch 函数 及 其 共享 变量 : 


#define BUFSIZE 100 


char buf[ BUFSIZE]; /* buffer for ungetch */ 

int bufp = 0; /* next free position in buf */ 

int getch(void) /* get a (possibly pushedsback) character */ 
{ 


return (bufp > 0) ? buf[**bufp] : getchar(); 

} 

void ungetch(int c) /* push character back on input */ 

{ 

if (bufp >= BUFSIZE) 

printf("ungetch: too many characters\n"); else 

buf[bufp++] = c; 

} 

标准 库 中 提供 了 ungetc， 它 将 一 个 字符 压 回 到 校 中 ， 我 们 将 在 第 7H 


中 讨论 该 琅 数 。 为 了 提供 一 种 更 通用 的 方法 ， 我 们 在 这 里 使 用 了 一 个 
数组 而 不 是 一 个 字符 。 
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在 该 程序 中 加 入 取 模 (9%9) 运 算 符 ， 并 注意 考虑 负数 的 情况 。 


练习 dod 在 校 操作 中 添加 几 个 命令 ， 分 别 用 于 在 不 弹出 元 素 的 情况 下 
打印 校 顶 元 素 ; 复制 校 项 元 素 ;交换 校 顶 两 个 元 素 的 值 。 另 外 增加 一 个 
命令 用 于 清空 校 。 


练习 4.5 给 计算 絮 程 序 增加 访问 sin ` exp 与 pow 等 库 函 数 的 操作 。 有 
关 这 些 库 函 数 的 详细 信息 ， 参 见 附录 B.4 市 中 的 头 文 件 <math.h>。 


练习 4-6 给 计算 器 程序 增加 处 理 变量 的 命令 (提供 26 个 具有 单个 英文 
字母 变量 名 的 变量 很 容易 )。 增 加 一 个 变量 存放 最 近 打 印 的 值 。 


练习 407 编写 一 个 画 数 ungets(9)， 将 整个 字符 串 s 压 回 到 输入 中 。 
ungets 画 数 需要 使 用 buf 和 bufp 吗 ? 它 能 否 仅 使 用 ungetch 画 数 ? 


练习 498 假定 最 多 只 压 回 一 个 字符 。 请 相应 地 修改 getch 与 
ungetch 这 两 个 函数 。 练习 429 以 上 介绍 的 getch 与 ungetch E 


数 不 能 正确 地 处 理 压 回 的 EOF。 考 虑 压 回 
EOF 时 应 该 如 何 处 理 ? 请 实现 你 的 设计 方案 。 


练习 4°10 另 一 种 方法 是 通过 getline 函数 读 入 整个 输入 行 ， 这 
种 情况 下 可 以 不 使 用 


getch 与 ungetch 函数 。 请 运用 这 一 方法 修改 计算 壤 程 序 。 
4.4 作用 域 规则 
构成 C 语言 程序 的 函数 与 外 部 变量 可 以 分 开 进 行 编译 。 一 个 程序 可 以 
存放 在 几 个 文件 中 ， 原 先 已 编译 过 的 函数 可 以 从 库 中 进行 加 载 。 这 里 
我 们 感 兴趣 的 问题 有 : 
如 何 进 行 声 明 才能 确保 变量 在 编译 时 被 正确 声明 ? 
如 何 安排 声明 的 位 置 才 能 确保 程序 在 加 载 时 各 部 分 能 正确 连 


ee 


如 何 组 织 程序 中 的 声明 才能 确保 只 有 一 份 副 本 ? 
如 何 初始 化 外 部 变量 ? 


为 了 讨论 这 些 问题 ， 我 们 重新 组 织 前 面 的 计算 右 程 序 ， 将 它 分 散 到 多 
个 文件 中 。 从 实践 的 角 度 来 看 ， 计 算 船 程序 比较 小 ， 不 值得 分 成 儿 个 
文件 存放 ， 但 通过 它 可 以 很 好 地 说 明 较 大 的 程 序 中 过 到 的 类 似 问 题 。 


名 字 的 作用 域 指 的 是 程序 中 可 以 使 用 该 名 字 的 部 分 。 对 于 在 函数 开头 
声明 的 目 动 变量 来 说 ， 其 作用 域 是 声明 该 变量 名 的 函数 。 不 同 函 数 中 
声明 的 具有 相同 名 字 的 各 个 局 部 变量 之 间 RAEI KA WANS 
也 是 这 样 的 ， 实 际 上 可 以 将 它 看 作 是 局 部 变量 。 

处 部 变量 或 函数 的 作用 域 从 声明 它 的 地 方 开始 ， 到 其 所 在 的 ( 待 编译 
的 ) 文 件 的 末尾 结 束 。 例 如， 如 果 main ` sp ` val ` push 与 pop 是 依次 
定义 在 某 个 文件 中 的 5 个 函数 或 外 部 变量 ， 如 下 所 示 : 


main() {... } 


int sp = 0; 
double val[MAX VAL]; 


void push(double f) { ... } 


double pop(void) { ... } 
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访问 变量 sp 与 val， 但 是 ， 这 两 个 变量 名 不 能 用 在 main 函数 中 ，push 
与 pop 函数 也 不 能 用 在 main 函数 中 。 


另 一 方面 ， 如 采 要 在 外 部 变量 的 定义 之 前 使 用 该 变量 ， 或 者 外 部 变量 
的 定义 与 变量 的 使 用 不 在 同一 个 源 文件 中 ， 则 必须 在 相应 的 变量 声明 
中 强制 性 地 使 用 关键 子 extern 。 


将 外 部 变量 的 声明 与 定义 严格 区 分 开 来 很 重要 。 变 量 声明 用 于 说 明 变 
量 的 属性 (主要 是 变量 的 类 型 )， 而 变量 定义 除 此 以 外 还 将 引起 存储 器 
的 分 配 。 如 果 将 下 列 语句 放 在 所 有 函数 的 外 部 : 


int sp; 
double val[MAX VAL]; 


那么 这 两 条 语句 将 定义 外 部 变量 sp 与 val， 并 为 之 分 配 存储 单元 ， 同 
时 这 两 条 语句 还 可 以 作 为 该 源 文件 中 其 余部 分 的 声明 。 而 下 面 的 两 行 


eA): 
extern int sp; extern double vall]; 


为 源 文 件 的 其 余部 分 声明 了 一 个 int 类 型 的 外 部 变量 sp 以 及 一 个 
double 数组 类 型 的 外 部 变量 val( 该 数组 的 长 度 在 其 它 地 方 确定 )， 但 这 
两 个 声明 并 没有 建立 变量 或 为 它们 分 配 存储 单元 。 


在 一 个 源 程序 的 所 有 源 文 件 中 ， 一 个 外 部 变量 只 能 在 某 个 文件 中 定义 
一 次 ， 而 其 它 文件 可 以 通过 extern 声明 来 访问 它 ( 定 义 外 部 变量 的 源 
文件 中 也 可 以 包含 对 该 外 部 变量 的 extern 声明 )。 外 部 变量 的 定义 中 必 
须 指定 数组 的 长 度 ， 但 extern 声明 则 不 一 定 要 指定 数 组 的 长 度 。 


处 部 变量 的 初始 化 只 能 出 现在 其 定义 中 。 
假定 函数 push 与 pop 定义 在 一 个 文件 中 ， 而 变量 val 与 sp 在 另 一 个 文 


件 中 定义 并 被 初始 化 (通常 不 大 可 能 这 样 组 织 程序 )， 则 需要 通过 下 面 
这 些 定义 与 声明 把 这 些 函 数 和 变量 " 绑 定 "在 一 起 : 


在 文件 filel F: 

extern int sp; extern double val[]; 

void push(double f) { ... } 

double pop(void) { ... } 

在 文件 他 e2 F: 

int sp = 0; 

double val[MAXVAL]; 

由 于 文件 名 el 中 的 extern 声明 不 仅 放 在 函数 定义 的 外 面 ， 而 且 还 放 在 
它们 的 前 面 ， 因 此 它 们 适用 于 该 文件 中 的 所 有 函数 。 对 于 旭 e1， 这 样 


一 组 声明 束 够 了 。 如 琳 要 在 同一 个 文件 中 先 使 用 、 后 定义 变量 sp 与 
val， 也 需要 按照 这 种 方式 来 组 织 文件 。 
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如 果 该 程序 的 各 组 成 部 分 很 长 ， 这 么 做 还 是 有 必要 的 。 我 们 这 样 分 割 : 
F EKRI main 单独 放 在 文件 main.c 中 ;将 push 与 pop 函数 以 及 它们 使 
用 的 外 部 变量 放 在 第 二 个 文件 stack.c 中 ;将 getop 男 数 放 在 第 三 个 文件 
getop.c 中 ;将 getch 与 ungetch 函数 放 在 第 四 个 文件 getch.c 中 。 之 所 以 
el: 主要 是 考虑 在 实际 的 程序 中 ， 它 们 分 别 来 自 于 单独 
编译 的 库 。 


此 外 ， 还 必须 考虑 定义 和 声明 在 这 些 文件 之 间 的 共享 问题 。 我 们 尽 可 
能 把 共享 的 部 分 集 中 在 一 起 ， 这 样 就 只 需要 一 个 副本 ， 改 进程 序 时 也 
容易 保证 程序 的 正确 性 。 我 们 把 这 些 公共 部 分 放 在 头 文件 calc.h 中 ， 
在 需要 使 用 该 头 文件 时 通过 #include 指令 将 它 包 含 进来 (#include 指令 
将 在 4.11 节 中 介绍 )。 这 样 分 割 后 ， 程 序 的 形式 如 下 所 示 : 


calc.h 


#define HUMBER ’0’ 
void push(double) ; 
double pop(void); 
int getop(char []); 
int getch(void); 
void ungetch(int); 


main.c getop.c stack.c 
#include <stdio.h> #include <stdic.h> #include <stdio.h> 


#include <stdlib.h> #include <ctype.h> #include “calc.h" 
#include “calc.h" #include “calc.h" #define MAXVAL 100 


#define MAXOP 100 getop() { int sp = 0; 
main() { Sex double val [MAXVAL] ; 
} void push(double) { 
} nas 
double pop(void) { 
getch.c owe 
#include <stdio.h> } 


#define BUFSIZE 100 
char buf [BUFSIZE] ; 
int bufp = 0; 

int getch(void) { 


} 
void ungetch(int) { 


} 


我 们 对 下 面 两 个 因素 进行 了 折 囊 :一 方面 是 我 们 期 望 每 个 文件 只 能 访问 
它 完 成 任务 所 需 的 信息 ; 另 一 方面 是 现实 中 维护 较 多 的 头 文件 比较 困 
难 。 我 们 可 以 得 出 这 样 一 个 结论 :对 于 某 些 中 等 规模 的 程序 ， 最 好 只 用 
一 个 头 文 件 存 放 程 序 中 各 部 分 共 至 的 对 象 。 较 大 的 程序 需要 使 用 更 多 
的 头 文件 ， 我 们 需要 精心 地 组 织 它们 。 


某 些 变量 ， 比 如 文件 stack.c 中 定义 的 变量 sp 与 val 以 及 文件 getch.c 
中 定义 的 变量 buf 与 bubfp， 它 们 仅 供 其 所 在 的 源 文件 中 的 函数 使 用 ， 
其 它 函 数 不 能 访问 。 用 static 声明 限定 外 部 变量 与 范 数 ， 可 以 将 其 后 
声明 的 对 象 的 作用 域 限 定 为 被 编译 源 文件 的 剩余 部 分 。 通过 static 限 
定 外 部 对 象 ， 可 以 达到 隐藏 外 部 对 象 的 目的 ， 比 如 ，getch*ungetch 复 
合 结构 需要 共享 buf 与 bufp 两 个 变量 ， 这 样 buf 与 bufp 必须 是 外 部 
人 
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要 将 对 象 指定 为 静态 存储 ， 可 以 在 正常 的 对 象 声 明 之 前 加 上 关键 字 
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static char buf[ BUFSIZE]; /* buffer for ungetch */ static int bufp = 
0; /* next free position in buf */ 


int getch(void) { ... } 
void ungetch(int c) { ... } 


那么 其 它 函 数 就 不 能 访问 变量 buf 与 bufp， 因 此 这 两 个 名 字 不 会 和 同 
程序 中 的 其 它 文件 中 的 相同 的 名 字 相 冲突 。 同 样 ， 可 以 通过 把 变量 
a 声明 为 静态 类 型 隐藏 这 两 个 由 执行 校 操 作 的 push 与 pop 函数 
AR St o 
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flav T, KA 名 字 是 全 局 可 访问 的 ， 对 整个 程序 的 各 个 部 分 而 言 都 
可 见 。 但 是 ， 如 果 把 函数 声明 为 static 类 型 ， 则 该 函数 名 除了 对 该 函 
数 声明 所 在 的 文件 可 见 外 ， 其 它 文 件 都 无 法 访问 。 


static 也 可 用 于 声明 内 部 变量 。static 类 型 的 内 部 变量 同 自动 变量 一 
样 ， 是 某 个 特定 函数 的 局 部 变量 ， 只 能 在 该 函数 中 使 用 ， 但 它 与 目 动 
变量 不 同 的 是 ,不管 其 所 在 函数 是 否 补 调用 ， 它 一 直 存在 ， 而 不 像 目 
动 变量 那样 ， 随 着 所 在 函数 的 被 调用 和 退出 而 存在 和 消失 。 换 句 话 
Ui, static 类 型 的 内 部 变量 是 一 种 只 能 在 某 个 特定 函数 中 使 用 但 一 直 占 
据 存 储 空间 的 变量 。 


练习 4°11 修改 getop 函数 ， 使 其 不 必 使 用 ungetch 函数 。 提 示 : 
可 以 使 用 一 个 


static 类 型 的 内 部 变量 解决 该 问题 。 

4.7 寄存 器 变量 

register 声明 告诉 编译 器 ， 它 所 声明 的 变 量 在 程序 中 使 用 频率 较 高 "其 
思想 是 ， 将 register 变量 放 在 机 器 的 寄存 右 中 ， 这 样 可 以 使 程序 更 小 、 
执行 速度 更 快 。 但 编译 絮 可 以 忽略 此 选 页 。 


register 声明 的 形式 如 下 所 示 : 


register int x; register char c; 


register 声明 只 适用 于 目 动 变量 以 及 函数 的 形式 参数 。 下 面 是 后 一 种 情 
况 的 例子 : 


f(register unsigned m, register long n) 


{ 


register int 1; 


} 
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些 类 型 的 变量 。 但 是 ， 过 量 的 寄存 器 声明 并 没有 什么 害处 ， 这 是 因为 
编译 右 可 以 忽略 过 量 的 或 不 文 持 的 寄存 器 变量 声明 。 男 外 ， 无 论 寄存 
磺 变 量 实际 上 有 是 不 是 存放 在 寄存 器 中 ， 它 的 地 址 都 是 不 能 访问 的 (有 关 
这 一 点 更 详细 的 信息 ， 我 们 将 在 第 5 草 中 讨论 )。 在 不 同 的 机 器 中 ， 

对 寄存 器 变 量 的 数目 和 类 型 的 具体 限制 也 是 不 同 的 。 


4.8 程序 块 结构 


C 语言 并 不 是 Pascal 等 语言 意义 上 的 程序 块 结构 的 语言 ， 它 不 允许 在 
函数 中 定义 函数 。 但 是 ， 在 函数 中 可 以 以 程序 块 结构 的 形式 定义 变 
量 。 变 量 的 声明 (包括 初始 化 ) 除 了 可 以 紧 跟 在 函数 开始 的 花 括 号 之 
后 ， 还 可 以 紧 跟 在 任何 其 它 标识 复合 语句 开始 的 左 伦 括号 之 后 。 以 这 
种 方式 声明 的 变量 可 以 隐藏 程序 块 外 与 之 同名 的 变量 ， 它 们 之 间 没 有 
任何 关系 ， 并 在 与 左 花 括号 匹配 的 右 花 括号 出 现 之 前 一 直 存 在 。 例 
如 ， 在 下 面 的 程序 段 中 : 


if (n> 0) { 


int i; /* declare a new i */ 


for (i = 0; i < n; i++) 


变量 i 的 作用 域 是 让 语句 的 " 真 " 分 文 ， 这 个 让 与 该 程序 块 外 声明 的 i 无 
天 。 每 次 进入 程 序 块 时 ， 在 程序 块 内 声明 以 及 初始 化 的 目 动 变量 都 将 
被 初始 化 。 静 态 变 量 只 在 第 一 次 进入 程 序 块 时 被 初始 化 一 次 。 


目 动 变量 (包括 形式 参数 ) 也 可 以 隐藏 同名 的 外 部 变量 与 函数 。 在 下 面 


的 声明 中 : 
int x; int y; 
f(double x) 
{ 

double y; 

} 


函数 f 内 的 变量 x 引 用 的 是 函数 的 参数 ， 类 型 为 double; 面 在 函数 f 
Sh, x we int 类 型 的 外 部 变量 。 这 段 代 码 中 的 变量 y 也 是 如 此 。 


在 一 个 好 的 程序 设计 风格 中 ， 应 该 避免 出 现 变量 名 隐藏 外 部 作用 域 中 
相同 名 字 的 情况 ， 否则 ， 很 可 能 引起 混乱 和 错误 。 


4.9 初始 化 


前 面 我 们 多 次 提 到 过 初始 化 的 概念 ， 不 过 始终 没有 详细 讨论 。 本 广 将 
对 前 面 讨论 的 各 种 


存储 类 的 初始 化 规则 做 一 个 总 结 。 

在 不 进行 显 式 初始 化 的 情况 下 ， 外 部 变量 和 静态 变量 都 将 被 初始 化 为 
0, TOA SIS maT ARRE EEA E EAA 
息 )。 


定义 标量 变量 时 ， 可 以 在 变量 名 后 暴 跟 一 个 等 号 和 一 个 表达 式 来 初始 


int x = 1; 
char squota = '\"; 
long day = 1000L * 60L * 60L * 24L; /* milliseconds/day */ 


对 于 外 部 变量 与 静态 变量 来 说 ， 初 始 化 表达 式 必 须 是 常量 表达 式 ， 且 
只 初始 化 一 次 (从 概念 上 讲 是 在 程序 开始 执行 前 进行 初始 化 )。 对 于 目 
动 变量 与 寄存 器 变量 ， 则 在 每 次 进入 函数 或 程 序 块 时 都 将 被 初始 化 。 


对 于 目 动 变 量 与 寄存 此 变量 来 说 ， 初 始 化 表达 式 可 以 不 是 常量 表达 式 : 
表达 式 中 可 以 包 含 任意 在 此 表达 式 之 前 已 经 定义 的 值 ， 包 括 函 数 调 
H, RITE 3.3 市 中 介绍 的 折 半 查找 程序 的 初始 化 可 以 采用 下 列 形式 


int binsearch(int x, int v[], int n) 
{ 
int low = 0; 


int high = n ° 1; int mid; 


} 
RATE ZL: 


int low, high, mid; 


low = 0; 

high =n 1; 

SEI, ADIN S OT fal S ETE) ° FERAL P 
形式 ， 还 得 看 个 人 的 习惯 。 考 虑 到 变量 声明 中 的 初始 化 表达 式 容 易 被 
人 名 上 略 ， 且 距 使 用 的 位 置 较 远 ， 我 们 一 般 使 用 显 式 的 赋值 语句 。 
数组 的 初始 化 可 以 在 声明 的 后 面 紧 跟 一 个 初始 化 表达 式 列表 ， 初 始 化 


表达 式 列 表 用 人 花 括 号 括 起 来 ， 各 初始 化 表达 式 之 间 通 过 逗号 分 隔 。 例 
和 


int days[] = {31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}; 


S AURA AIS BERY , Saba RE Cte Ss Poa IAT PRUE A 
数组 的 长 度 ， 在 本 例 中 数组 的 长 度 为 12。 


如 果 初 始 化 表达 式 的 个 数 比 数组 元 索 数 少 ， 则 对 外 部 变量 、 静 仿 变 量 
和 目 动 变量 来 说 ， 没 有 初始 化 表达 式 的 元 素 将 被 初始 化 为 0， 如 果 初 
始 化 表达 式 的 个 数 比 数组 元 素数 多 ， 则 是 错 误 的 。 不 能 一 次 将 一 个 初 
台 化 表达 式 指 定 给 多 个 数组 元 素 ， 也 不 能 跳 过 前 面 的 数组 元 素 而 直 接 
初始 化 后 面 的 数组 元 素 。 


字符 数组 的 初始 化 比较 特殊 :可 以 用 一 个 字符 溃 来 代 蔡 用 花 括 号 括 起 来 
并 用 逗号 分 隔 的 初始 化 表达 式 序列 。 例 如 : 


char pattern[] = "ould "; 


它 同 下 面 的 声明 是 等 价 的 : 


Tir wor ot 


这 种 情况 下 ， 数 组 的 长 度 是 5(4 个 字符 加 上 一 个 字符 串 结束 符 \0 。 
4.10 递归 


C 语言 中 的 函数 可 以 递归 调用 ， 即 函数 可 以 直接 或 间接 调用 目 身 。 我 
们 考虑 一 下 将 一 个 数 作为 字符 串 打 印 的 情况 。 前 面 讲 过 ， 数 字 是 以 反 
人 
TEN ° 


解决 该 问题 有 两 种 方法 。 一 种 方法 是 将 生成 的 各 个 数字 依次 存储 到 一 
个 数组 中 ， 然 后 再 以 相反 的 次 序 打印 它们 ， 这 种 方式 与 3.6 节 中 itoa 
BAH PES SURED, © APPT IZ Me EAB, EW BY printd 首先 调 
用 它 目 身 打印 前 面 的 (高 位 ) 数 字 ， 然 后 再 打印 后 面 的 数字 。 这 里 编写 
的 函数 不 能 处 理 最 大 的 负数 。 


#include <stdio.h> 


/* printd: print n in decimal */ void printd(int n) 
{ 

if (n < 0) { putchar('s’); n = en; 

} 

if (n/ 10) 

printd(n / 10); 

putchar(n % 10 + '0'); 


} 


函数 递归 调用 上 自身 时 ， 每 次 调用 都 会 得 到 一 个 与 以 前 的 上 自动 变量 集合 
不 同 的 新 的 自动 变 量 集合 。 因 此 ， 调 用 printd(123) 时 ， 第 一 次 调用 
printd 的 参数 n=123。 它 把 12 传递 给 printd 的 第 二 次 调用 ， 后 者 又 把 
1 传递 结 printd 的 第 三 次 调用 。 第 三 次 调用 printd 时 首先 将 打印 1， 然 
后 再 返回 到 第 二 次 调用 。 从 第 三 次 调用 返回 后 的 第 二 次 调用 同样 也 将 
先 打印 2， 然 后 再 返回 到 第 一 次 调用 。 返 回 到 第 一 次 调用 时 将 打 3， 随 
之 结束 函数 的 执行 。 


另外 一 个 能 较 好 说 明 递 归 的 例子 是 快速 排序 。 快 速 排序 算法 是 C. A. 
R. Hoare 于 1962 年 发 明 的 。 对 于 一 个 给 定 的 数组 ， 从 中 选择 一 个 元 
素 ， 以 该 元 聚 为 界 将 其 余 元 素 划分 为 两 个 子 集 ， 一 个 子 集中 的 所 有 元 
素 都 小 于 该 元 宗 ， 男 一 个 子 集中 的 所 有 元 素 都 大 于 或 等 于 该 元 素 。 对 
这 样 两 个 子 集 递归 执行 这 一 过 程 ， 当 某 个 子 集中 的 元 素数 小 于 2 时 ， 
这 个 子 集束 不 需要 再 次 排序 ， 终 止 递 归 。 

从 执行 速度 来 讲 ， 下 列 版 本 的 快速 排序 范 数 可 能 不 古 最 快 的 ， 但 它 是 
最 简单 的 算法 之 一 。 在 每 次 划分 子 集 时 ， 该 算法 总 十 选取 各 个 子 数 组 
的 中 间 元 素 。 

/* qsort: sort v[left]...v[right] into increasing order */ void qsort(int 
v[], int left, int right) 


{ 
int i, last; 


void swap(int v[], int i, int j); 


if (left >= right) /* do nothing if array contains */ return; /* fewer 
than two elements */ 


swap(vy, left, (left + right)/2); /* move partition elem */ last = left; A 
to v[0] */ 
for (i = left + 1; i <= right; i++) /* partition */ if (v[i] < v[left]) 


swap(v, ++last, i); 


swap(v, left, last); /* restore partition elem */ qsort(v, left, 
last1); 


qsort(v, last+1, right); 
} 


这 里 之 所 以 将 数组 元 素 交 换 操 作 放 在 一 个 单独 的 函数 swap 中 ， 是 因 
KEE gsort 函数 中 要 使 用 3 ° 


/* swap: interchange v[i] and v[j] */ void swap(int v[], int i, int j) 

{ 

int temp; 

temp = vli]; vli] = vlj]; v[j] = temp; 

i; 

标准 库 中 提供 了 一 个 qsort 函数 ， 它 可 用 于 对 任何 类 型 的 对 象 排序 。 
递归 并 不 和 省 存储 器 的 开销 ， 因 为 递归 调用 过 程 中 必须 在 某 个 地 方 维 
护 一 个 存储 处 理 值 


的 校 。 递 归 的 执行 速度 并 不 快 ， 但 递归 代码 比较 紧 次 ， 并 且 比 相应 的 
非 递归 代码 更 易于 编写 


与 理解 。 在 描述 树 等 递归 定义 的 数据 结构 时 使 用 递归 尤其 方便 。 我 们 
将 在 6.5 市 中 介绍 一 个 比 较 好 的 例子 。 


练习 4°12 运用 printd 函数 的 设计 思想 编写 一 个 递归 版 本 的 itoa 函数 ， 
即 通过 递归 调用 把 整数 转换 为 字符 吝 。 


练习 4°13 编写 一 个 递归 版 本 的 reverse) RAL, LORE ATER s 倒 
置 o 


4.11 C MALHA 


C ER IOE et [Ee a fe ° Ma Li, MARE 
编译 过 程 中 单独 执行 WB TER o DA ince AS Uh Be tia 

ve #include 指令 (用 于 在 编译 期 间 把 指定 文 件 的 内 容 包含 进 当 前 文件 
中 ) 和 大 efine 指令 (用 任意 字符 序列 蔡 代 一 个 标记 )。 本 下 还 将 介 绍 预 处 
理 需 的 其 它 一些 特 性 ， 如 条 件 编译 与 市 参数 的 宏 。 


4.11.1. 文件 包含 


文件 包含 指令 ( 即 #include 指令 ) 使 得 处 理 大 量 的 #define 指令 以 及 声明 
更 加 方便 。 在 源 文件 中 ， 任 何 形 如 


#include "文件 名 " 


或 
#include < 文件 名 > 


的 行 都 将 被 蔡 换 为 由 文件 名 指定 的 文件 的 内 容 。 如 采 文 件 名 用 引号 3 
起 来 ， 则 在 源 文件 所 在 位 置 查找 该 文件 ;如 果 在 该 位 置 没 有 找到 文件 ， 
或 者 如 采 文 件 名 十 用 人 尖 插 号 < 与 > 括 起 来 的 ， 则 将 根据 相应 的 规则 查找 
该 文件 ， 这 个 规则 同 具体 的 实现 有 关 。 被 包含 的 文件 本 喘 也 可 包含 


#include 指令 。 

源 文 件 的 开始 处 通常 都 会 有 多 个 #include 指令 ， 它 们 用 以 包含 常见 的 
#define 语句 和 extern 声明 ， 或 从 头 文件 中 访问 库 函 数 的 函数 原型 声 
明 ， 比 如 <stdio.h>。( 严 格 地 说 ， 这 些 内 容 没 有 必要 单独 存放 在 文件 
中 ;访问 头 文 件 的 细节 同 具 体 的 实现 有 关 。) 

在 大 的 程序 中 ，#include 指令 是 将 所 有 声明 捆绑 在 一 起 的 较 好 的 方 
法 。 它 保证 所 有 的 源 文件 都 具有 相同 的 定义 与 变量 声明 ， 这 样 可 以 避 
免 出 现 一 些 不 必要 的 错误 。 很 自然 ， 如 果 某 个 包含 文件 的 内 容 发 生 了 
变化 ， 那 么 所 有 依赖 于 该 包含 文件 的 源 文件 都 必须 重新 编译 。 

4.11.2. TRF Hoh 

宏 定 义 的 形式 如 下 : 

#define 名 字 BHE 

这 是 一 种 最 简单 的 宏 替换 一 一 后 续 所 有 出 现 名 字 记 号 的 地 方 都 将 被 蔡 
换 为 砍 换 文本 。 

#define 指令 中 的 名 字 与 变量 名 的 命名 方式 相同 ， 符 换文 本 可 以 是 任意 
字符 串 。 通 常情 况 下 ， 

#define 指令 占 一 行 ， 替 换文 本 是 #define 指令 行 尾 部 的 所 有 剩余 部 分 内 
容 ; -得志 机 以 把 一 


个 较 长 的 安定 义 分 成 者 干 行 ， 这 时 需要 在 待 续 的 行 末尾 加 上 一 个 反 和 斜 
FLIS ° #define 指令 


定义 的 名 字 的 作用 域 从 其 定义 点 开始 ， 到 被 编译 的 源 文件 的 末尾 处 结 
束 。 安 定义 中 也 可 以 使 


用 前 面 出 现 的 宏 定 义 。 替 换 只 对 记号 进行 ， 对 括 在 引号 中 的 字符 串 不 
起 作用 。 例 如 ， 如 果 YES 


是 一 个 通过 #define 指令 定义 过 的 名 字 ， 则 在 printf("YES") 或 
YESMAN 中 将 不 执行 替换 。 


蔡 换 文本 可 以 是 任意 的 ， 例 如 : 


#define forever for (;;) /* infinite loop */ 


该 语句 为 无 限 循环 定义 了 一 个 新 名 字 forever。 宏 定义 也 可 以 市 参数 ， 
这 样 可 以 对 不 同 的 安 调 用 使 用 不 同 的 蔡 换 文本 。 例 如 ， 下 列 安 定 


义 定 义 了 一 个 宏 max: 
#define max(A, B) ((A) > (B) ? (A) : (B) 
使 用 宏 max AER Re WR, (ERA RR ee AN ig Al] 


代码 中 。 形 式 参数 (在 此 为 A 或 B) 的 每 次 出 现 都 将 被 蔡 换 成 对 应 的 实 
际 参数 。 因 此 ， 语 句 ]: 


x = max(p+q, r+s); 
将 被 蕉 换 为 下 列 形式 : 
X=((p+q) > (r+s) ? (p+q) : (r+s)); 


如 条 对 各 种 类 型 的 参数 的 处 理 是 一 致 的 ， 则 可 以 将 同一 个 安定 义 应 用 
于 任何 数据 关 型 ， 而 无 需 寺 对 不 同 的 数据 类 型 需要 定义 不 同 的 max EG 


数 


仔细 考虑 一 下 max 的 展开 式 ， 束 会 发 现 它 存在 一 些 缺 陷 。 其 中 ， 作 为 
参数 的 表达 式 要 重 复 计算 两 次 ， 如 果 表 达 式 存在 副作用 (比如 含有 自 
增 运 算 符 或 输入 /输出 )， 则 会 出 现 不 正确 的 情况 。 例 如 : 

max(i++, j++) /* WRONG */ 


它 将 对 每 个 参数 执行 两 次 目 增 操作 。 同 时 还 必须 注意 ， 要 适当 使 用 圆 
括号 以 保证 计算 次 序 的 正确 性 。 考 虚 下 列 宏 定义 : 


#define square(x) x*x /* WRONG */ 


当 用 squrare(z+1)Val LIZ E MIT S WT Zale? 但 是 ， 宏 还 是 很 
有 价值 的 。<stdio.h> 头 文件 中 有 一 个 很 实用 的 例子 :getchar 与 


putchar 丽 数 在 实际 中 常常 被 定义 为 宏 ， 这 样 可 以 避免 处 理 字符 时 调用 
函数 所 需 的 运行 时 开 


销 。<ctype.h> 头 文件 中 定义 的 函数 也 第 党 是 通过 安 实现 的 。 


可 以 通过 #undef HEPA FWE, AF ARWEN Say H 
re BAVA, TAN 是 安 调 用 : 


#undef getchar 

int getchar(void) { ... } 

WEA BU Be AD | SEAT RR Bæ, AREA MAH, 2 
数 名 以 # 作 为 前 级 则 SR ACE RAT SEIS BIOS PRIA SBA TH S| 
Peal ° 例 如， 可 以 将 它 与 字符 串 连 接 运 算 结合 起 来 编写 一 个 调试 
TH 


#define dprint(expr) printf(#expr " = %g\n", expr) 
使 用 语句 

dprint(x/y) 

调用 该 宏 时 ， 该 宏 将 被 扩展 为 : 


printf("x/y" " = &g\n", x/y); 
其 中 的 字符 串 被 连接 起 来 了 ， 这 样 ， 该 宏 调用 的 效果 等 价 于 
printf("x/y = &g\n", x/y); 


EMER, EARI ERRERA", EAN BCS AN, 
此 替换 后 的 字符 串 是 合法 的 字符 种 常量 。 


预 处 理 需 运算 符 疹 为 安 扩 展 提 供 了 一 种 连接 实际 参数 的 手段 。 如 采 蔡 
换文 本 中 的 参数 与 


## 相 邻 ， 则 该 参数 将 被 实际 参数 蔡 换 ， 震 与 前 后 的 至 日 符 将 被 删除 ， 
并 对 车 换 后 的 结果 重新 


扫描 。 例 如 ， 下 面 定 义 的 宏 paste 用 于 连接 两 个 参数 
#define paste(front, back) front ## back 

因此 ， 宏 调用 paste(name, 1) 的 结果 将 建立 记号 namel e 
HS EE A UI POE DA AE, PEAT aS PN Se A e 


练习 4°14 定义 宏 swap(t, x, y) 以 交换 t 类 型 的 两 个 参数 。( 使 用 
程序 块 结构 会 对 你 有 所 帮助 。) 


4.11.3. 条 件 包含 


还 可 以 使 用 条 件 语句 对 预 处 理 本 身 进行 控制 ， 这 种 条 件 语句 的 值 是 在 
预 处 理 执行 的 过 程 中 进行 计算 。 这 种 方式 为 在 编译 过 程 中 根据 计算 所 
得 的 条 件 值 选择 性 地 包 合 不 同 代 码 提供 了 一 种 手段 。 


#if 语句 对 其 中 的 常量 整 型 表达 式 (其 中 不 能 包含 sizeof、 类 型 转换 运算 
从 或 enum 常 量 ) 进 行 求 值 ， 大 该 表达 式 的 值 不 等 于 0， 则 包含 其 后 的 
各 行 ， 直 到 过 到 #endif、#elif 或 

#else 语句 为 止 ( 预 处 理 絮 语句 #elif 类 似 于 else if)。 在 #f 语句 中 可 以 使 
用 表达 式 defined( 名 字 )， 该 表达 式 的 值 遵 循 下 列 规则 : 当 名 字 已 经 定义 
时， 其 值 为 ”1; 否 则 ， 其 值 为 0。 


例如 ， 为 了 保证 hdrh 文件 的 内 容 只 被 包含 一 次 ， 可 以 将 该 文件 的 内 容 
包含 在 下 列 形式 的 条 件 语句 中 : 


#if !defined(HDR) 


#define HDR 
/* hdr.h 文件 的 内 容 放 在 这 里 */ 
#endif 


第 一 次 包含 头 文件 hdr.h 时 ， 将 定义 名 字 HDR; 此 后 再 次 包含 该 头 文件 
时 ， 会 发 现 该 名 字 已 经 定义 ， 这 样 将 直接 跳 转 到 #endif 处 。 类 似 的 方 
式 也 可 以 用 来 避免 多 次 重复 包 侣 同一 文件 。 如果 多 个 头 文件 能 够 一 至 
地 使 用 这 种 方式 ， 那 么 ， 每 个 头 文件 都 可 以 将 它 所 依赖 的 任何 头 文 件 
包含 进来 ， 用 户 不 必 考 虑 和 处 理 头 文件 之 间 的 各 种 依赖 关系 。 


下 面 的 这 段 预 处 理 代码 首先 测试 系统 变量 SYSTEM， 人 然后 根据 该 变量 
的 值 确定 包含 哪个 版 本 的 头 文件 : 


#if SYSTEM == SYSV 


#define HDR "sysv.h" 


#elif SYSTEM == BSD 
#define HDR "bsd.h" 

#elif SYSTEM == MSDOS 
#define HDR "msdos.h" 
#else 

#define HDR "default.h" 
#endif 

#include HDR 


C 语言 专门 定义 了 两 个 预 处 理 语句 扩 fdef 与 责 血 def， 它们 用 来 测试 某 个 
名 字 是 否 已 经 定义 。 上 面 有 关 #f 的 第 一 个 例子 可 以 改写 为 下 列 形式 : 


#ifndef HDR 


#define EDR 
/* hdr.h 文件 的 内 容 放 在 这 里 */ 


#endif 


第 5 章 指针 与 数组 


旨 针 是 一 种 保存 变量 地 址 的 变量 。 在 C 语言 中 ， 指 针 的 使 用 非常 广 
泛 ， 原 因 之 一 是 ， 指 针 津 稼 是 表达 某 个 计算 的 惟一 途径 ， 男 一 个 原因 
古 ， 同 其 它 方法 比较 起 来 ， 使 用 指针 通 和 党 可 以 生成 更 高 效 、 更 紧凑 的 
代码 。 指 针 与 数组 之 间 的 关系 十 分 密切 ， 我 们 将 在 本 章 中 讨论 它们 之 
间 的 关系， 并 探讨 如 何 利用 这 种 关系。 


指针 和 goto 语句 一 样 ， 会 导致 程序 难以 理解 。 如 果 使 用 者 粗心 ， 指 针 
(RAD Mia I fa 译 的 地 方 。 但 是 ， 如 采 谨 慎 地 使 用 指针 ， 便 可 以 利 
用 它 写 出 简单 、 清 晰 的 程序 。 在 本 章 中 我 们 将 尽力 说 明 这 一 点 。 


ANSI C 的 一 个 最 重要 的 变化 是 ， 它 明确 地 制定 了 操纵 指针 的 规则 。 事 

实 上， 这 些 规则 已 经 被 很 多 优秀 的 程序 设计 人 员 和 编译 器 所 采纳 。 此 

So 
类 型 。 


5.1 指针 与 地 址 


下 和 完 ， 我 们 通过 一 个 简单 的 示意 图 来 说 明 内 存 是 如 何 组 织 的。 通常 的 
机 器 都 有 一 系列 连续 编写 或 编 址 的 存储 单元 ， 过 些 存 储 单元 可 以 单个 
进行 操纵 ， 也 可 以 以 连续 成 组 的 方式 操纵 。 通常 情况 下 ， 机 需 的 一 个 
字 市 可 以 存放 一 个 char 类 型 的 数据 ， 两 个 相 邻 的 字 节 存储 单元 可 存储 
一 个 short( 短 整 型 ) 类 型 的 数据 ， 而 4 个 相 令 的 子 节 存储 单元 可 存储 
一 个 long( 长 整 型 ) 类 型 的 数据 。 指 针 是 能 够 存放 一 个 地 址 的 一 组 存储 
单元 (通常 是 两 个 或 4 个 字 节 )。 因 此 ， 如 果 c 的 类 型 是 char， 并 且 
ÆFA c 的 指针 ， 则 可 用 图 5.1 表示 它们 之 间 的 关系 : 


图 5.1 
一 元 运算 符 & 可 用 于 取 一 个 对 象 的 地 址 ， 因 此 ， 下 列 语句 : 


p= &c; 


将 把 c 的 地 址 赋值 给 变量 P， 我 们 称 p 为 " 指 疝 ”c 的 指针 。 地 址 运算 
符 区 只 能 应 用 于 内 存 中 的 对 象 ， 即 变量 与 数组 元 素 。 它 不 能 作用 于 表 
达 式 、 常 量 或 register 类 型 的 变量 。 

一 元 运算 符 * 征 间接 寻 址 或 间接 引用 运算 符 。 当 它 作 用 于 指针 时 ， 将 访 
问 指 针 所 指向 的 对 象 。 我 们 在 这 里 假定 x 与 y 是 整数 ， 而 ip 古 指 癌 
int 类 型 的 指针 ， 下 面 的 代码 段 说 明了 如 何在 程序 中 声明 指针 以 及 如 
何 使 用 运算 人 符 & 和 *: 


int x = 1, y = 2, z[10]; 


int *ip; /* ip is a pointer to int */ 


ip = &x; /* ip now points to x */ 


y = *ip; /* y is now 1 */ 
*ip = 0; /* x is now 0 */ 
ip = &z[0]; /* ip now points to z[0] */ 


变量 x、y 与 z 的 声明 方式 我 们 已 经 在 前 面 的 草 市 中 见 到 过 。 我 们 来 看 
指针 ip 的 声明 ， 如 下 所 示 : 


int *ip; 

这 样 声 明 是 为 了 便于 记忆 。 该 声明 语句 表明 表达 式 *ip 的 结果 是 int 类 
型 。 这 种 声明 变量 的 语法 与 声明 该 变量 所 在 表达 式 的 语法 类 似 。 同 样 
的 原因 ， 对 函数 的 声明 也 可 以 采用 这 种 方式 。 例 如 ， 声 明 

double *dp, atof(char *); 


表明 ， 在 表达 式 中 ，*dp 和 atof(s) 的 值 都 是 double 类 型 ， 日 atof 的 参 


数 是 一 个 指 网 char 
类 型 的 指针 。 


我 们 应 该 注意 ， 指 针 只 能 指 同 茶 种 特定 类 型 的 对 象 ， 也 吕 是 说 ， 每 个 
指针 都 必须 指 同 某 种 特定 的 数据 类 型 。( 一 个 例外 情况 是 指 癌 void 类 
型 的 指针 可 以 存放 指 加 任何 类 型 的 指针 ， 但 它 不 能 间接 引用 其 目 身 。 
我 们 将 在 5.11 方 中 详细 讨论 该 问题 )。 


如 果 指 针 ip 指 疝 整 型 变量 ， 那 么 在 x 可 以 出 现 的 任何 上 下 文中 都 可 以 
使 用 *ip， 因 此 ， 语 句 


*ip = *ip + 10; 


将 把 *ip 的 值 增加 10° 一 元 运算 符 * 和 & 的 优先 级 比 算术 运算 符 的 优先 
级 高 ， 因 此 ， 赋 值 语句 


y=*ip+1 


将 把 *ip 指向 的 对 象 的 值 取出 并 加 1， 然 后 再 将 结果 赋值 给 y， 而 下 列 
赋值 语句 : 


*ip += 1 

则 将 ip 指向 的 对 象 的 值 加 1， 它 等 同 于 

++*ip 

at 

(*ip)++ 

语句 的 执行 结果 。 语 句 (*ip)++ 中 的 圆 括号 是 必需 的 ， 否 则 ， 该 表达 式 
将 对 ip 进行 加 1 运算， 而 不 是 对 ip 指向 的 对 象 进行 加 1 运算 ， 这 是 
因为 ， 类 似 于 * 和 ++ 这 样 的 一 元 运算 符 遵循 从 右 至 左 的 结合 顺序 。 
最 后 说 明 一 点 ， 由 于 指针 也 是 变量 ， 所 以 在 程序 中 可 以 直接 使 用 ， 而 


不 必 通 过 间接 引用 的 方法 使 用 。 例 如 ， 如 有 果 iq 是 男 一 个 指 同 整 型 的 指 
针 ， 那 么 语 名 


iq = ip 
将 把 ip 中 的 值 找 贝 到 iq 中， 这样 ， 指 针 iq 也 将 指 问 ip FRIAR © 


5.2 Fa FT I BSR 


由 于 C Ha EMREIS SO SS 8 2 a A Bo AE, BCH 
用 函数 不 能 直接 修 CSE Valen a EL o LGN, HEAP EMR] BE oe 
用 一 个 名 为 swap 的 函数 来 交换 两 个 次 序 题 倒 的 元 素 。 但 是 ， 如 林 将 

swap 函数 定义 为 下 列 形 式 : 


void swap(int x, int y) /* WRONG */ 


{ 

int temp; 

temp = x; x = y; 

y = temp; 

} 

则 下 列 语句 无 法 达到 该 目的 。 

swap(a, b); 

这 是 因为 ， 由 于 参数 传递 采用 传 值 方 式 ， 因 此 上 壕 的 swap 函数 不 会 
i € 的 例 程 中 的 参数 a 和 bb 的 值 。 该 函数 仅仅 交换 了 a Ab 


那么 ， 如 何 实现 我 们 的 目标 昵 ， 可 以 使 主 调 程序 将 指 回 所 要 交换 的 要 
量 的 指针 传递 给 被 Va ENB, BN: 


swap(&a, &b); 
由 于 一 元 运算 符 & 用 来 取 变 量 的 地 址 ， 这 样 &a 就 是 一 个 指向 变量 a 的 


指针 。swap 函数 的 所 有 参数 都 声明 为 指针 ， 并 且 通 过 这 些 指针 来 间 
接 访 问 它们 指 问 的 操作 数 。 


void swap(int *px, int *py) /* interchange *px and *py */ 


{ 

int temp; 

temp = *px; 

“px = “py; 

“py = temp; 

} 

我 们 通过 图 5.2 进行 说 明 。 


in caller: 
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JAETA QUE Fa ie Val H EN He is V A) A CE Yel ET REL © FCAT] 
来 看 这 样 一 个 例子 : 函数 getint 接受 目 由 格式 的 输入 ， 并 执行 转换 ， 将 
输入 的 字符 流 分 解 成 整数 ， 且 每 次 调用 得 到 一 个 整数 。getint 需要 返 
回转 换 后 得 到 的 整数 ， 并 且 ， 在 到 达 输 入 结尾 时 要 返回 文件 结 束 标 
记 。 这 些 值 必须 通过 不 同 的 方式 返回 。EOF( 文 件 结束 标记 ) 可 以 用 任 
何 值 表示 ， 当 然 也 可 用 一 个 输入 的 整数 表示 。 


可 以 这 样 设计 该 函数 :将 标识 是 否 到 达 文 件 结尾 的 状态 作为 getint 函数 


的 返回 值 ， 同 时 ， 使 用 一 个 指针 参数 存储 转换 后 得 到 的 整数 并 传 回 给 
主 调 函数 。 男 数 scanf 的 实现 束 采 用 了 这 种 方法 ， 具 体 细 太 请 参见 7.4 
TJ ° 


下 面 的 循环 语句 调用 getint 函数 给 一 个 整 型 数组 赋值 : 

int n, array[ SIZE], getint(int *); 

for (n = 0; n < SIZE && getint(&array[n]) != EOF; n++) 

每 次 调用 getint 时 ， 输 入 流 中 的 下 一 个 整数 将 被 赋值 给 数组 元 素 
array[n], JEF, n 的 值 将 增加 1。 请 注意 ， 这 里 必须 将 array[n] 的 地 址 


getint, MIEZ getint 将 无 法 把 转换 得 到 的 整数 传 回 给 调 


该 版 本 的 getint 函数 在 到 达 文 件 结尾 时 返回 EOF， 当 下 一 个 输入 不 是 
数字 时 返回 0， 当 输入 中 包含 一 个 有 意义 的 数字 时 返回 一 个 正 值 。 


#include <ctype.h> 

int getch(void); void ungetch(int); 

/* getint: get next integer from input into *pn */ int getint(int *pn) 
{ 

int c, sign; 


while (isspace(c = getch())) /* skip white space */ 


if (lisdigit(c) && c != EOF && c !='+' && c !='*') { ungetch(c); /* 
it is not a number */ 


return 0; 

} 

sign = (c ==") ? ¢1: 1; 

if (c == '+' || c == '*') c = getch(); 

for (*pn = 0; isdigit(c), c = getch()) 

*pn = 10 * *pn + (c ° '0'); 

*pn *= sign; if (c != EOF) 

ungetch(c); return C; 

} 

在 getint AL, *pn 始终 作为 一 个 普通 的 整 型 变量 使 用 。 其 中 还 使 用 
T getch 和 ungetch 两 个 函数 (参见 4.3 世 )， 借 助 这 两 个 函数 ， 画 数 
getint 必须 读 入 的 一 个 多 余 字 符 束 可 以 重 新 写 回 到 输入 中 。 

练习 5.1 ” ” 在 上 面 的 例子 中 ， 如 果 符 号 + 或 的 后 面 紧 跟 的 不 是 数 
字 ，getint ACSI 符号 视 为 数字 0 的 有 效 表达 方式 。 修 改 该 画 数 ， 
将 这 种 形式 的 + 或 人 符号 重新 写 回 到 输入 流 中 。 


练习 502 模仿 函数 getint 的 实现 方法 ， 编 写 一 个 读 取 浮 点 数 的 
函数 getfloat 。 getfloat 函数 的 返回 值 应 该 是 什么 类 型 ? 


5.3 指针 与 数组 
在 C 语言 中 ， 指 针 和 数组 之 间 的 关系 十 分 密切 ， 因 此 ， 在 接 下 来 的 部 


分 中 ， 我 们 将 同时 讨论 指针 与 数组 。 通 过 数组 下 标 所 能 完成 的 任何 操 
作 都 可 以 通过 指针 来 实现 。 一 般 来 说 ， 用 指针 编写 的 程序 比 用 数组 下 


标 编写 的 程序 执行 速度 快 ， 但 另 一 方面 ， 用 指针 实现 的 程序 理解 起 来 
稍微 困难 一 些 。 


声明 
int a[10]; 
定义 了 一 个 长 度 为 10 的 数组 a。 换 名 话说 ， 它 定义 了 一 个 由 10 个 对 


象 组 成 的 集合 ， 这 10 个 对 象 存 储 在 相 邻 的 内 存 区 域 中 ， 名 字 分 别 为 
a[0]、a[1]、 、a[9]( 参 见 图 5.3)。 


a J TTT | | 


a[0] a[i1] als] 
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af[j] 表 示 该 数组 的 第 i 个 元 素 。 如 果 pa 的 声明 为 
int *pa; 


Ut Ee 8 I ADT ATT, ABA, WEA 


pa = &a[0]; 


则 可 以 将 指针 pa 指向 数组 a 的 第 0 个 元 素 ， 也 就 是 说 ，pa 的 值 为 数 
组 元 素 a[0] 的 地 址 ( 参 见 图 5.4)。 


5°4 

这 样 ， 赋 值 语句 

x = *pa; 

将 把 数组 元 素 a[0] 中 的 内 容 复 制 到 变量 x 中 。 

如 果 pa 指向 数组 中 的 某 个 特定 元 素 ， 那 么 ， 根 据 指针 运算 的 定义 ， 
pa+1 将 指向 下 一 个 mA, pati 将 指向 pa 所 指向 数组 元 素 之 后 的 第 i 
AIA, M pari 将 指向 pa 所 指向 数 组 元 素 之 前 的 第 i 个 元 素 。 
此 ， 如 果 指 针 pa 指向 a[0]， 那 么 *(pa+1) 引 用 的 是 数组 元 素 a[1] 的 内 


容 ，pati 是 数组 元 素 a[i] 的 地 址 ，*(pa+i) 引 用 的 是 数组 元 素 ali MINA 
(& 见 图 5°5) ° 


pa: pati: = pat2: > 
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无 论 数组 a 中 元 素 的 类 型 或 数组 长 度 是 什么 ， 上 面 的 结论 都 成 立 。" 指 
针 加 1" 融 意味 着 ， pa+l TIA) pa 所 指 加 的 对 象 的 下 一 个 对 象 。 相 应 
HE, pati 指向 pa 所 指 癌 的 对 象 之 后 的 第 i 个 对 象 。 


下 标 和 指针 运算 之 间 具 有 密切 的 对 应 关系 。 根 据 定 义 ， 数 组 类 型 的 变 
量 或 表达 式 的 值 是 该 数组 第 0 个 元 素 的 地 址 。 执 行 赋值 语句 


pa = &a[0]; 


Ja, pata 具有 相同 的 值 。 因 为 数组 名 所 代表 的 束 是 该 数组 最 开始 的 
一 个 元 素 的 地 址 ， 所 以 ， 同 值 语 句 pa=&a[0] 也 可 以 写成 下 列 形式 : 


pa = a; 


对 数组 元 素 alia S| Ath Ay LAS (ati PFE. o TER UR 
写法 的 人 来 说 ， 可 能 会 觉得 很 奇怪 。 在 计算 数组 元 素 a[i 的 值 时 ，C 
语言 实际 上 先 将 其 转换 为 *(a+ti) 的 形 式 ， 然 后 再 进行 求 值 ， 因 此 在 程 
序 中 这 两 种 形式 是 等 价 的 。 如 果 对 这 两 种 等 价 的 表示 形式 分 别 施加 地 
址 运算 符 &， 便 可 以 得 出 这 样 的 结论 :&ar 和 ati 的 含义 也 是 相同 的 。 


ati 是 a 


之 后 第 i 个 元 素 的 地 址 。 相 应 地 ， 如 采 pa 是 个 指针 ， 那 么 ， 在 表达 式 
中 也 可 以 在 它 的 后 面 加 下 标 。pa[i 与 *(pa+i 征 等 价 的 。 简 而 言 之 ， 一 
个 通过 数组 和 下 标 实现 的 表达 式 可 等 价 地 通过 指针 和 偏 移 量 实现 。 


但 是 ， 我 们 必须 记 住 ， 数 组 名 和 指针 之 间 有 一 个 不 同 之 处 ， 指 针 是 一 
个 变量 ， 因 此 ， 在 C 语言 中 ， 语 句 paza 和 pa++ 都 是 合法 的 。 但 数组 
名 不 是 变量 ， 因 此 ， 类 似 于 a=pa 和 a++ 形 式 的 语句 是 非法 的 。 


当 把 数组 名 传递 给 一 个 琅 数 时 ， 实 际 上 传递 的 是 该 数组 第 一 个 元 索 的 
HHE o ERK 数 中 ， 该 参数 是 一 个 局 部 变量 ， 因 此 ， 数 组 名 参数 
必须 是 一 个 指针 ， 也 就 是 一 个 存储 地 址 值 的 变量 。 我 们 可 以 利用 该 特 
性 编写 strlen 函数 的 男 一 个 版 本 ， 该 画 数 用 于 计算 一 个 字符 串 的 长 


BE 


/* strlen: return length of string s */ int strlen(char *s) 


{ 

int n; 

for (n = 0; *s !='\0', s++) n++; 

return n; 

} 

因为 s 是 一 个 指针 ， 所 以 对 其 执行 自 增 运算 是 合法 的 。 执 行 s++ 运 算 


不 会 影响 到 strlen EX 数 的 调用 者 中 的 字符 串 ， 它 仅 对 该 指针 在 strlen 
函数 中 的 私有 副本 进行 目 增 运算 。 因 此 ， 类 似 于 下 面 这 样 的 画 数 调用 : 


strlen("hello, world"); /* string constant */ 
strlen(array); /* char array[100]; */ 
strlen(ptr); /* char *ptr; */ 


都 可 以 正确 地 执行 。 在 函数 定义 中 ， 形 式 参数 


char s[]; 


和 

char *s; 

是 等 价 的 。 我 们 通常 更 习惯 于 使 用 后 一 种 形式 ， 因 为 它 比 前 者 更 直观 
地 表明 了 该 参数 是 一 个 指针 。 如 采 将 数组 名 传递 给 函数 ， 函 数 可 以 根 
据 情 况 判 定 是 按照 数组 处 理 还 是 按照 指针 处 理 ， 随后 根据 相应 的 方式 
操作 该 参数 。 为 了 直观 且 恰 当地 撒 述 函数 ， 在 函数 中 甚至 可 以 同时 使 
用 数组 和 指针 这 两 种 表示 方法 。 

也 可 以 将 指 辣子 数组 起 始 位 置 的 指针 传递 给 函数 ， 这 样 ， 就 将 数组 的 
oe 数 。 例 如 ， 如 果 a 是 一 个 数组 ， 那 么 下 面 两 个 函数 
Yi 

f(&a[2]) 

与 

f(a+2) 


都 将 把 起 始 于 a[2] 的 子 数组 的 地 址 传递 给 函数 f。 在 函数 f 中， 参数 的 
声明 形式 可 以 为 


f(int arr[]) { ... } 
或 
f(int *arr) { ... } 


对 于 函数 f 来 说 ， 它 并 不 关心 所 引用 的 是 否 只 是 一 个 更 大 数组 的 部 分 
元 素 。 如 条 确信 相应 的 元 素 存 在 ， 也 可 以 通过 下 标 访问 数组 第 一 个 元 
素 之 前 的 元 素 。 类 似 于 


p[*1]、p[*2] 这 样 的 表达 式 在 语法 上 都 是 合法 的 ， 它 们 分 别 引 用 位 于 
p[0] 之 前 的 两 个 元 素 。 


当然 ， 引 用 数组 边界 之 外 的 对 象 是 非法 的 。 
5.4 地 址 算术 运算 


如 果 p 是 一 个 指向 数组 中 某 个 元 素 的 指针 ， 那 么 p++ 将 对 p 进行 目 增 
运算 并 指 癌 下 一 个 oR, M p+=i 将 对 p 进行 加 i 的 增 量 运算 ， 使 其 指 
回 指 针 p 当前 所 指向 的 元 素 之 后 的 第 i 个 元 素 。 这 类 运算 是 指针 或 地 
址 算术 运算 中 最 简单 的 形式 。 


C 语言 中 的 地 址 算术 运算 方法 是 一 致 有 旦 有 规律 的 ， 将 指针 、 数 组 和 地 
址 的 算术 运算 集成 在 一 起 是 该 语言 的 一 大 优点 。 为 了 说 明 这 一 点 ， 我 
们 来 看 一 个 不 完善 的 存储 分 配 程序 。 它 由 两 个 函数 组 成 。 第 一 个 函数 
alloc(n) 返 回 一 个 指 癌 n 个 连续 字符 存储 单元 的 指针 ，alloc EH 数 的 调 
用 者 可 利用 该 指针 存储 字符 序列 。 第 二 个 函数 afree(p) 释 放 已 分 配 的 存 
储 空 间 ， 以 便 以 后 重用 。 之 所 以 说 这 两 个 函数 是 "不 完善 的 "， 是 因为 
对 afree 函数 的 调用 次 序 必 须 与 调用 alloc 函数 的 次 序 相 反 。 换 句 话 
tt, alloc 与 afree 以 校 的 方式 ( 即 后 进 先 出 的 列表 ) 进行 存储 空间 的 管 
理 。 标 准 库 中 提供 了 具有 类 似 功能 的 画 数 malloc 和 free， 它 们 没有 上 
i 限制 ， 我 们 将 在 8.7 $ FPH OT {ey SCE EE BY o 


最 容易 的 实现 方法 是 让 alloc 函数 对 一 个 大 字符 数组 allocbuf 中 的 空间 
进行 分 配 。 该 数组 是 alloc 和 afree 两 个 函数 私有 的 数组 。 由 于 画 数 

alloc 和 afree 处 理 的 对 象 是 指 针 而 不 是 数组 下 标 ， 因 此 ， 其 它 函 数 无 
需 知道 该 数组 的 名 字 ， 这 样 ， 可 以 在 包含 aloc 和 afree 的 源 文件 中 将 


该 数组 声明 为 static 类 型 ， 使 得 它 对 外 不 可 见 。 实 际 实现 时 ， 该 数组 
甚至 可 以 没有 名 字 ， 它 可 以 通过 调用 malloc 函数 或 癌 操 作 系统 申请 一 
个 指向 无 名 存储 块 的 指针 获得 。 


allocbuf 中 的 空间 使 用 状况 也 是 我 们 需要 了 人 解 的 信息 。 我 们 使 用 指针 
allocp #8I=] allocbuf 中 的 下 一 个 空 朵 单元 。 当 调用 alloc 申请 mn 个 字符 
的 空间 时 ，alloc 检查 allocbuf 数组 中 有 没有 足够 的 剩余 至 间 。 如 果 有 
足够 的 空 闪 空间 ， 则 alloc 返回 allocp 的 当前 值 ( 即 空 内 块 的 开始 位 
置 )， 然 后 将 allocp 加 mn 以 使 它 指 癌 下 一 个 空间 区 域 。 如 果 空 内 空间 不 
够 ， 则 alloc 返回 0。 如 果 p 在 allocbuf 的 边界 之 内 ， 则 afree(p) 仅 仅 只 
是 将 allocp 的 值 设 置 为 p( 参 见 图 56) ° 


#define ALLOCSIZE 10000 /* size of available space */ 


static char allocbuf[ALLOCSIZE]; /* storage for alloc */ static char *allocp 
= allocbuf; /* next free position */ 


char *alloc(int n) /* return pointer to n characters */ 


{ 


if (allocbuf + ALLOCSIZE œ allocp >= n) { /* it fits */ allocp += n; 


return allocp ° n; /* old p */ 


} else /* not enough room */ return 0; 

} 

void afree(char *p) /* free storage pointed to by p */ 
{ 


if (p >= allocbuf && p < allocbuf + ALLOCSIZE) allocp = p; 
} 


before call to alloc: 


allocp: ~ 
allocbuf: | | | | 
+—— im use 人 ee 一 一 
after call to alloc: isg: jeg 
allocbuf: | | | | | 
“ in use e- free - 
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一 般 情 况 下 ， 同 其 它 类 型 的 变量 一 样 ， 指 针 也 可 以 初始 化 。 通 浓 ， 对 
有 意义 的 初始 化 值 只 能 是 0 或 者 是 表示 地 址 的 表达 式 ， 对 后 者 来 
说 ， 表 达 式 所 代表 的 地 址 必须 是 在 此 前 已 定义 的 具有 适当 类 型 的 数据 
的 地 址 。 例 如 ， 声 明 


static char* allocp = allocbuf; 


将 allocp 定义 为 字符 类 型 指针 ， 并 将 它 初 始 化 为 allocbuf 的 起 始 地 
o 序 执行 时 的 下 一 个 空 内 位 置 。 上 壕 语句 也 可 以 写 
E PIII: 


static char* allocp = &allocbuf[0]; 


这 是 因为 该 数组 名 实际 上 就 是 数组 第 0 个 元 素 的 地 址 。 下 列 正 测试 语 
f: 


if (allocbuf + ALLOCSIZE ° allocp >= n) { /* it fits */ 


难得 是 否 有 足够 的 空前 空间 以 满足 n FFFA ER o WRT 
空间 足够 ， 则 分 配 存 储 空间 后 allocp 的 新 值 至 多 比 allocbuf 的 尾 端 
地 址 大 1。 如 有 果 存储 空间 的 申请 可 以 满足 ，alloc 将 返回 一 个 指 同 所 需 
大 小 的 字符 块 首 地 址 的 指针 (注意 函数 本 喘 的 声明 )。 如 采 申 请 无 法 满 
XE, alloc 必须 返回 某 种 形式 的 信号 以 说 明 没有 足够 的 空 几 空间 可 供 分 
配 。C 语言 保证 ，0 永远 不 是 有 效 的 数据 地 址 ， 因 此 ， 返 回 值 0 可 用 
来 表示 发 生 了 异常 事件 。 在 本 例 中 ， 返 回 值 


0 表示 没有 足够 的 空 内 空间 可 供 分 配 。 


指针 与 整数 之 间 不 能 相互 转换 ， 但 0 是 惟一 的 例外 :常量 0 可 以 赋值 给 

Bet, 指针 也 可 以 和 常量 0 进行 比较 。 程 序 中 经 常用 符号 和 常量 NULL 
代 巷 常量 0， 这 样 便于 更 清晰 地 说 明 常 量 0 是 指针 的 一 个 特殊 值 。 符 
号 常量 NULL 定义 在 标准 头 文件 <stddef.h> 中 。 我 们 在 后 面部 分 经 常 
会 用 到 NULL 。 


类 似 于 


if (allocbuf + ALLOCSIZE « allocp >= n) { /* it fits */ 
以 及 
if (p >= allocbuf && p < allocbuf + ALLOCSIZE) 


的 条 件 测试 语句 表明 指针 算术 运算 有 以 下 几 个 重要 特点 。 首 和 完 ， 在 某 
些 情 况 下 对 指针 可 以 进行 比较 运算 。 例 如 ， 如 来 指针 p 和 gq 指 问 同一 
个 数组 的 成 员 ， 那 么 它们 之 间 就 可 以 进行 类 似 于 ==、!=、<、>= 的 天 
REPOS o WR p 指向 的 数组 元 素 的 位 置 在 q TETRA ENA ME 
之 前 ， 那 么 关系 表 达 式 


p<q 

的 值 为 真 。 任 何 指针 与 0 进行 相等 或 不 等 的 比较 运算 都 有 意义 。 但 
征 ， 指 回 不同 数组 的 元 素 的 指针 之 间 的 算术 或 比较 运算 没有 定义 。 
(这 里 有 一 个 特例 :指针 的 算术 运算 中 可 使 用 数组 最 后 一 个 元 素 的 下 一 
个 元 素 的 地 址 。) 


aes 指针 可 以 和 整数 进行 相 加 或 相 减 运算 。 
VQ, LEK 


ptn 


表示 指针 p 当前 指向 的 对 象 之 后 第 n 个 对 象 的 地 址 。 无 论 指 针 p TAA 
的 对 象 古 何 种 类 型 ， 上 述 结 论 都 成 立 。 在 计算 ptn WY, n 将 根据 p 指 
回 的 对 象 的 长 度 按 比 例 缩 放 ， 而 p THAT AR 的 长 度 则 取决 于 p 的 声 
明 。 例 如 ， 如 果 int 类 型 占 4 个子 市 的 存储 空间 ， 那 么 在 int 类 型 的 计 
算 中 ， 对 应 的 n 将 按 4 的 倍数 来 计算 。 


站 针 的 减法 运算 也 十 有 意义 的 :如 有 果 p 和 gq 指向 相同 数组 中 的 元 索 ， 且 
p<q, HA qep+1 整 古 位 于 p Aq 指 同 的 元 索 之 间 的 元 系 的 数目 。 我 们 
由 此 可 以 编写 出 函数 strlen 的 另 一 个 版 本 ， 如 下 所 示 : 


/* strlen: return length of string s */ int strlen(char *s) 


{ 


char *p = s; 

while (*p != ^0) p++; 
return p ° S; 

} 


在 上 壕 程 序 段 的 声明 中 ， 指 针 p 被 初始 化 为 指 癌 s， 即 指 辐 该 字符 串 
的 第 一 个 字符 。while 循环 语句 将 依次 检查 字符 串 中 的 每 个 字符 ， 直 
到 遇 到 标识 字符 数组 结尾 的 字符 \0' 为 止 。 由 于 p 是 指 癌 字符 的 指 
针 ， 所 以 每 执行 一 次 p++，p 就 将 指 癌 下 一 个 字符 的 地 址 ，pes 则 表示 
已 经 检查 过 的 字符 数 ， 即 字符 串 的 长 度 。( 字 符 串 中 的 字符 数 有 可 能 超 
过 int 类 型 所 能 表示 的 最 大 范围 。 头 文件 <stddef.h> 中 定义 的 类 型 
ptrdiff_t 足以 表示 两 个 指针 之 间 的 融和 符号 差 值 。 但 是 ， 我 们 在 这 里 使 
用 size_t 作为 函数 strlen 的 返回 值 类 型 ， 这 样 可 以 与 标准 库 中 的 函数 
版 本 相 人 匹配 。Size t 是 由 运算 符 sizeof 返回 的 无 人 符号 整 型 。) 


指针 的 算术 运算 具有 一 致 性 :如 果 处 理 的 数据 类 型 是 比 字 符 型 占据 更 多 
存储 空间 的 浮 点 类 型 ， 并 且 p 古 一 个 指 疝 浮 点 类 型 的 指针 ， 那 么 在 执 
ÍT p++ 后 , p 将 指 癌 下 一 个 浮 点 数 的 地 址 。 因 此 ， 只 需要 将 alloc 和 
afree 函数 中 所 有 的 char 类 型 替换 为 float 类 型 ， 就 可 以 得 到 一 个 适用 
于 浮 点 类 型 而 非 字 人 符 型 的 内 存 分 配 画 数 。 所 有 的 指针 运算 都 会 目 动 考 
虚 它 所 指 向 的 对 象 的 长 度 。 


有 效 的 指针 运算 包括 相同 类 型 指针 之 间 的 赋值 运算 ;指针 同 整数 之 间 的 
加 法 或 减法 运算 ; 指向 相同 数组 中 元 素 的 两 个 指针 间 的 减法 或 比较 运 
算 ; 将 指针 赋值 为 0 或 指针 与 0 之 间 的 比 较 运算 。 其 它 所 有 形式 的 指针 
运算 都 是 非法 的 ， 例 如 两 个 指针 间 的 加 法 、 乘 法 、 除 法 、 移 位 BCR MC 
运算 ;指针 间 float 或 double 类 型 之 间 的 加 法 运算 ;不 经 强制 类 型 转换 而 
直接 将 指 同一 种 类 型 对 象 的 指针 赋值 给 指 辐 另 一 种 类 型 对 象 的 指针 的 
运算 (两 个 指针 之 一 是 void * 类 型 的 情况 除外 ) 。 


5.5 字符 指针 与 函数 字符 串 常量 是 一 个 字符 数 
组 ， 例 如 : "I am a string" 


在 字符 串 的 内 部 表示 中 ， 字 符 数 组 以 空 字 符 \0' 结 尾 ， 所 以 ， 程 序 可 以 
前 过 检查 空 字符 找到 


通 
字符 数组 的 结尾 。 子 符 串 常量 占据 的 存储 单元 数 也 因此 比 双 引 号 内 的 
THARAIS 


FIRE Ea A A ee EA Be, Ah: 


princf("hello, world\n"}; 


SRTA SE ee PT, Sch be rs FT 
访问 该 字符 串 的 。 在 上 述 语 句 中 ，printf 接受 的 是 一 个 指向 字符 数组 

第 一 个 字符 的 指针 。 也 就 是 说 ， 字 符 串 常量 可 通过 一 个 指 癌 其 第 一 个 
元 素 的 指针 访问 。 


R TERHARU, FR HDA CHIE ° RETE pmessage 
AY RHAN P: 


char *pmessage; 
ABA, WAJ 
pmessage ="now is the time"; 


将 把 一 个 指 同 该 字符 数组 的 指针 赋值 给 pmessage。 该 过 程 并 没有 进行 
字符 串 的 复制 ， 而 只 是 涉及 到 指针 的 操作 。C 语言 没有 提供 将 整个 字 


符 串 作为 一 个 整体 进行 处 理 的 运算 符 。 
下 面 两 个 定义 之 间 有 很 大 的 差别 : 


char amessage[] = "nw is the time"; /# 定义 一 个 数组 */ char 
*pmessage = "now is the time"; JE EAA 


EEH, amessage 是 一 个 仅仅 足以 存放 初始 化 字符 串 以 及 空 字 
符 \0' 的 一 维 数 组 。 数 组 中 的 单个 字符 可 以 进行 修改 ， 但 amessage 始 
终 指 回 同一 个 存储 位 置 。 另 一 方面 ，pmessage 是 一 个 指针 ， 其 初 值 指 
加 一 个 字符 串 常 量 ， 之 后 它 可 以 被 修改 以 指 回 其 它 地 址 ， 但 如 果 试 图 
修改 字符 串 的 内 容 ， 结 果 是 没有 定义 的 (参见 图 57) 。 


amessage: of now is the time\0 


pmessage: now is the time\0 


5。7 


为 了 更 进一步 地 讨论 指针 和 数组 其 它 方面 的 问题 ， 下 面 以 标准 库 中 两 
个 有 用 的 函数 为 例 来 全 究 它们 的 不 同 实现 版 本 。 第 一 个 函数 strcpy(s， 
b 把 指针 t 指 回 的 字符 哩 复制 到 指针 s 指向 的 位 置 。 如 果 使 用 语句 s=t 
实现 该 功能 ， 其 实质 上 只 是 拷贝 了 指针 ， 而 并 没有 复制 字 符 。 为 了 进 
行 字符 的 复制 ， 这 里 使 用 了 一 个 循环 语句 。strcpy 函数 的 第 1 个 版 本 
征 通过 数组 方法 实现 的 ， 如 下 所 示 : 


/* strcpy: copy t to s; array subscript version */ void strcpy(char *s, 
char *t) 


{ 

int i; 

i=0; 

while ((s[i] = t[i]) != \0") i++; 

} 

为 了 进行 比较 ， 下 面 是 用 指针 方法 实现 的 strepy 画 数 : 
/* strcpy: copy t to s; pointer version */ void strcpy(char *s, char *t) 
{ 

int 1; 

i=0; 

while ((*s = *t) != \0") { s++; 

t++; 

} 

} 


因为 参数 是 通过 值 传递 的 ， 所 以 在 strcpy 函数 中 可 以 以 任何 方式 使 用 
ER s FUto Æ, s 和 t 是 方便 地 进行 了 初始 化 的 指针 ， 循 环 每 执行 
一 次 ， 它 们 就 沿 着 相应 的 数组 前 进 一 个 字符 ， 直到 将 t 中 的 结束 
符 \0' 复 制 到 s 为 止 。 


实际 上 ，strcpy 函数 并 不 会 按照 上 面 的 这 些 方式 编写 E BS 
序 员 更 喜欢 将 它 编 写成 下 列 形式 : 


/* strcpy: copy t to s; pointer version 2 */ void strcpy(char *s, char 


{ 


while ((*s++ = *t++) !='\0') 


} 


在 该 版 本 中 ，s 和 t 的 目 增 运算 放 到 了 循环 的 测试 部 分 中 。 表 达 式 
*t++ 的 值 是 执行 目 增 运算 之 前 t 所 指向 的 字符 。 后 弘 运 算 符 ++ 表 示 在 
读 取 该 字符 之 后 才 改 变 t 的 值 。 同 样 的 道理 ， 在 s 执行 目 增 运算 之 
前 ， 字 符 束 被 存储 到 了 指针 s 指向 的 旧 位 置 。 该 字符 值 同 时 也 用 来 和 
T 字符 \0' 进 行 比较 运算 ， 以 控制 循环 的 执行 。 最 后 的 结果 是 依次 将 t 
指向 的 字符 复制 到 s 指 向 的 位 置 ， 直 到 直到 结束 符 \0' 为 止 ( 同 时 也 复 
制 该 结束 符 )， 


为 了 更 进一步 地 精炼 程序 ， 我 们 注意 到 ， 表 达 式 同 \0' 的 比较 是 多 余 
的 ， 因 为 只 需要 判 断 表 达 式 的 值 是 否 为 0 即 可 。 因 此 ， 该 画 数 可 进 一 
步 写成 下 列 形式 .: 


/* strcpy: copy t to s; pointer version 3 */ void strcpy(char *s, char 


{ 


while (*st++ = *t++) 


} 


该 函数 初 看 起 来 不 太 容 易 理 解 ， 但 这 种 表示 方法 是 很 有 好 处 的 ， 我 们 
应 该 掌握 这 种 方法 ，C 语 言 程序 中 经 滑 会 采用 这 种 写法 。 


标准 库 (<string.h>) 中 提供 的 函数 strcpy 把 目标 字符 串 作 为 贸 数 值 返 
回 。 我 们 研究 的 第 二 个 函数 是 字符 串 比 较 函 数 stremp(s, t) ° XZE 
POF FT Rs Mt, 


并 且 根 据 s 按照 字典 顺序 小 于 、 等 于 或 大 于 t 的 结果 分 别 返 回 负 整 
数 、0 或 正 整 数 。 该 返回 值 


JE s 和 t 由 前 同 后 逐 字 符 比 较 时 过 到 的 第 一 个 不 相等 学 符 处 的 字符 的 


/* strcmp: return <0 if s<t, 0 if s==t, >0 if s>t */ int strcmp(char *s, 
char *t) 


{ 

int i; 

for (i = 0; sli] == t[i]; i++) 

if (s[i] == \O) return 0; 

return sli] ° tli]; 

} 

下 面 用 是 指针 方式 实现 的 strcmp 函数 : 


/* strcmp: return <0 if s<t, 0 if s==t, >0 if s>t */ int strcmp(char *s, 
char *t) 


{ 

for (; *s == *t; s++, t++) if (*s == '\0') 

return 0; return *s 。 *t; 

} 

FT ++ Alle RE LEKTORI, EA LFA Se, Arb 


可 以 将 运算 符 * 与 运算 符 ++ 和 "按照 其 它 方式 组 合 使 用 ， 但 这 些 用 法 
并 不 多 见 。 例 如 ， 下 列表 达 式 


Keen 


在 读 取 指针 p 指向 的 字符 之 前 先 对 p HUT Uae ° FXE, FHN 
两 个 表达 式 : 


*p++ = val; /* 1% val He ABS */ 
val = *eep; /* 将 校 顶 元 素 弹 出 到 val 中 */ 


是 进 校 和 出 校 的 标准 用 法 。 更 详细 的 信息 ， 请 参见 4.3 T7 o 头 文件 
<string.h> 中 包含 本 节 提 到 的 函数 的 声明 ， 男 外 还 包括 标准 库 中 其 它 一 
ES es 


王子 付 


串 处 理 函 数 的 声明 。 


练习 5°3 用 指针 方式 实现 第 2 章 中 的 函数 strcat ° 函数 strcat(s, t) 
将 t 指 向 的 字符 串 复制 到 s 指向 的 字符 串 的 尾部 。 

练习 5"4 编写 函数 strend(s, t) ° WRFFE t 出 现在 字符 串 s 的 
尾部 ， 该 函数 返回 1; 否 则 返回 0。 

练习 505 实现 库 函 数 strmncpy、strncat 和 strncmp， 它 们 最 多 对 参 


数字 符 串 中 


的 前 n SAAT ERLE o PIE, KZ strncpy(s, t, nF t PRA Bi n 个 
字符 复制 到 中 。 更 详细 的 说 明 请 参见 附录 B。 


练习 5°6 采用 指针 而 非 数 组 索引 方式 改写 前 面 章 方 和 练习 中 的 某 些 程 
序 ， 例 如 getline( 第 1、4 章 )，atoi、itoa 以 及 它们 的 变 体形 式 (第 2、 
3、4 章 )，reverse( 第 3 章 )，strindex、getop( 第 4 章 ) 等 等 。 


5.6 指针 数组 以 及 指向 指针 的 指针 


由 于 指针 本 身 也 是 变量 ， 所 以 它们 也 可 以 像 其 它 变 量 一 样 存储 在 数组 
中 。 下 面 通 过 编写 UNIX 程序 sort 的 一 个 简化 版 本 说 明 这 一 点 。 该 程 
序 按 字母 顺序 对 由 文本 行 组 成 的 集合 进行 排序 。 


我 们 在 第 3 章 中 曾 描述 过 一 个 用 于 对 整 型 数组 中 的 元 到 进行 排序 的 

shell 排序 函数 ， 并 在 第 4 章 中 用 快速 排序 算法 对 它 进行 了 改进 。 这 些 

排序 算法 在 此 仍然 是 有 效 的 ， 但 是 ， 现 在 处 理 的 是 长 度 不 一 的 文本 

行 。 并 且 与 整数 不 同 的 是 ， 它 们 不 能 在 单个 运算 中 完成 比较 或 移动 操 

- ua ` 方便 地 处 理 可 变 长 度 文本 行 的 数据 表示 
VF © 


我 们 引入 指针 数组 处 理 这 种 问题 。 如 果 竺 排序 的 文本 行 首尾 相连 地 存 
储 在 一 个 长 字符 数组 中 ， 那 么 每 个 文本 行 可 通过 指 癌 它 的 第 一 个 字符 
的 指针 来 访问 。 这 些 指针 本 号 可 以 存储 在 一 个 数组 中 。 这 样 ， 将 指 问 
两 个 文本 行 的 指针 传递 给 函数 strcmp 就 可 实现 对 这 两 个 文本 行 的 比 
较 。 当 交换 次 序 颠 倒 的 两 个 文本 行 时 ， 实 际 上 交换 的 是 指针 数组 中 与 
这 两 个 文本 行 相对 应 的 指针 ， 而 不 是 这 两 个 文本 行 本 喘 ( 参 见 图 

5.8) 。 


| defghi PL 4 defghi 
+ jklmnoparst | TV jklmnopqrst | 
5°8 


这 种 实现 方法 消除 了 因 移动 文本 行 本 映 所 市 来 的 复杂 的 存储 管理 和 巨 
大 的 开销 这 两 个 挛 生 问 题 。 


排序 过 程 包括 下 列 3 ER: 
读 取 所 有 输入 行 对 文本 行进 行 排序 按 次 序 打印 文本 行 


通常 情况 下 ， 最 好 将 程序 划分 成 者 干 个 与 问题 的 目 然 划分 相 一 致 的 函 
数 ， 并 通过 主 函 数控 制 其 它 函 数 的 执行 。 关 于 对 文本 行 排序 这 一 步 ， 
我 们 稍 后 再 做 说 明 ， 现 在 主要 考虑 数据 结构 以 及 输入 和 和 输出 画 数 。 


输入 函数 必须 收集 和 保存 每 个 文本 行 中 的 字符 ， 并 建立 一 个 指 癌 这 些 
文本 行 的 指针 的 数组 。 它 同时 还 必须 统计 输入 的 行 数 ， 因 为 在 排序 和 
打印 时 要 用 到 这 一 信息 。 由 于 输入 函数 只 能 处 理 有 限 数 目的 输入 行 ， 
所 以 在 输入 行 数 过 多 而 超过 限定 的 最 大 行 数 时 ， 该 男 数 返回 某 个 用 于 
表示 非法 行 数 的 数值 ， 例 如 1。 


输出 函数 只 需要 按照 指针 数组 中 的 次 序 依次 打印 这 些 文本 行 即 可 。 
#include <stdio.h> 
#include <string.h> 


#define MAXLINES 5000 /* max #lines to be sorted */ char 
*]ineptr[T MA XLINES]; /* pointers to text lines */ int readlines(char 
*lineptr[], int nlines); 


void writelines(char *lineptr[], int nlines); void qsort(char *lineptr[], int 
left, int right); 


/* sort input lines */ main() 
{ 
int nlines; /* number of input lines read */ 


if ((nlines = readlines(lineptr, MAXLINES)) >= 0) { gsort(lineptr, 0, 
nlines*1); writelines(lineptr, nlines); 


return 0; 

} else { 

printf("error: input too big to sort\n"); return 1; 
} 

} 


#define MAXLEN 1000 /* max length of any input line */ int 
getline(char *, int); 


char *alloc(int); 


/* readlines: read input lines */ 


int readlines(char *lineptr[], int maxlines) 

{ 

int len, nlines; 

char *p, line[MAXLEN]; 

nlines = 0; 

while ((len = getline(line, MAXLEN)) > 0) 

if (nlines >= maxlines || p = alloc(len) == NULL) return ¢1; 
else { 

line[lene1] = '\0'; /* delete newline */ strcpy(p, line); 
lineptr[nlines++] = p; 

} 

return nlines; 

} 

/* writelines: write output lines */ 

void writelines(char *lineptr[], int nlines) 

{ 

int i; 


for (i = 0; i < nlines; i++) printf("%s\n", lineptr[i]); 


} 


ARN getline 的 详细 信息 参见 1.9 ° 在 该 例子 中 ， 指 针 数 组 
lineptr 的 声明 是 新 出 现 的 重要 概念 : 


char *lineptr[MAXLINES]; 

它 表 示 lineptr 是 一 个 具有 MAXLINES 个 元 素 的 一 维 数组 ， 其 中 数组 
的 每 个 元 素 是 一 个 指 问 字 符 类 型 对 RATE ° ete, lineptrlile 
一 个 字符 指针 ， 而 *lineptr 扣 是 该 指 Ese i SMA N ESF o 


由 于 lineptr 本 吴 是 一 个 数组 名 ， 因 此 ， 可 按照 前 面 例子 中 相同 的 方法 
将 其 作为 指针 使 用， 这 样 ，writelines 函数 可 以 改写 为 : 


/* writelines: write output lines */ 
void writelines(char *lineptr[], int nlines) 

{ 

while (nlineses > 0) printf("%s\n", *lineptr++); 
} 

(注意 这 里 的 数组 变量 lineptr 可 以 改变 值 ) 


循环 开始 执行 时 ，*lineptr 指向 第 一 行 ， 每 执行 一 次 目 增 运算 部 使 得 
lineptr 指向 下 一 行 ， 同 时 对 nlines 进行 目 减 运算 。 


在 明确 了 输入 和 输出 函数 的 实现 方法 之 后 ， 下 面 便 可 以 着 手 考虑 文本 
行 的 排序 问题 了 。 在 这 里 需要 对 第 4 章 的 快速 排序 函数 做 一 些小 改动 : 
下 和 完 ， 需 要 修改 该 贸 数 的 声明 部 分 ;其 次 ， 需 要 调用 strcmp 函数 完成 
比较 运算 。 但 排序 算法 在 这 里 仍然 有 效 ， 不 需要 做 任何 改 

A O 


/* qsort: sort v[left]...v[right] into increasing order */ void 
qsort(char *v[], int left, int right) 


{ 
int i, last; 
void swap(char *v[], int i, int j); 


if (left >= right) /* do nothing if array contains */ return; ie 
fewer than two elements */ 


swap(vy, left, (left + right)/2); last = left; 
for (i = left+1; i <= right; i++) if (stremp(v[i], v[left]) < 0) 


swap(v, ++last, i); swap(v, left, last); qsort(v, left, laste1); qsort(v, last+1, 
right); 


} 
同样 ，swap 函数 也 只 需要 做 一 些 很 小 的 改动 : 


/* swap: interchange v[i] and v[j] */ void swap(char *v[], int i, int j) 
{ 


char *temp; 


temp = v[i]; vli] = vlj]; v[j] = temp; 
} 


AN v( 别 名 为 lineptr) 的 所 有 元 素 都 是 字 和 从 指针， 并且 temp 也 必须 是 
字符 指针 ， 因 此 


temp 与 v 的 任意 元 素 之 间 可 以 互相 复制 。 


练习 5。7 HS NBN readlines， 将 输入 的 文本 行 存储 到 由 main 函数 提供 
的 一 个 数 AP, 而 不 是 存储 到 调用 alloc 分 配 的 存储 空间 中 。 该 贸 数 
的 运行 速度 比 改写 前 快 多 少 ? 


5.7 多 维 数 组 


C 语言 提供 了 类 似 于 和 矩阵 的 多 维 数组 ， 但 实际 上 它们 并 不 像 指 针 数 组 
使 用 得 那样 广泛 。 本 市 将 对 多 维 数 组 的 特性 进行 介绍 。 


我 们 考虑 一 个 日 期 转换 的 问题 ， 把 某 月 某 日 这 种 日 期 表示 形式 转换 为 

某 年 中 第 几 天 的 表 示 形 式 ， 反 之 亦 然 。 例 如 ，3 月 工 日 是 非 同年 的 第 
60 天 ， 是 国 年 的 第 61 天 。 在 这 里 ， 我 们 定 义 下 列 两 个 函数 以 进行 日 

期 转换 :函数 day_of_year 将 某 月 某 日 的 日 期 表示 形式 转换 为 某 一 年 中 

第 几 天 的 表示 形式 ， 琅 数 month_day 则 执行 相反 的 转换 。 因 为 后 一 个 
函数 要 返回 两 个 值 ， 所 以 在 函数 month_day 中 ， 月 和 日 这 两 个 参数 使 
用 指针 的 形式 。 例 如 ， 下 列 语句 : 


month_day(1988, 60, &m, &d); 
将 把 m 的 值 设置 为 2， 把 d 的 值 设 置 为 29(2 月 29 日 )。 这些 函 数 都 要 
用 到 张 记录 每 月 天 数 的 表 ( 如 “ 9 月 有 30 天 "等 )。 对 半年 和 非 国 年 来 


th, 


每 个 月 的 天 数 不 同 ， 所 以 ， 将 这 些 天 数 分 别 存 放 在 一 个 二 维 数组 的 两 
行 中 比 在 计算 过 程 中 判 


It 2 月 有 多 少 天 更 容易 。 该 数组 以 及 执行 日 期 转换 的 函数 如 下 所 示 : 


static char daytab[2][13] = { 

{0, 31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}, 
{0, 31, 29, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31} 
}; 


/* day_of_year: set day of year from month & day */ int 
day_of_year(int year, int month, int day) 


{ 
int i, leap; 


leap = year%4 == 0 && year%100 != 0 || year%400 == 0; for (i = 1; i < 
month; i++) 


day += daytab[leap][i]; return day; 

} 

/* month_day: set month, day from day of year */ 
void month_day(int year, int yearday, int *pmonth, int *pday) 
{ 

int i, leap; 


leap = year%4 == 0 && year%100 != 0 || year%400 == 0; for (i = 1; 
yearday > daytab[leap][i]; i++) 


yearday *= daytab[leap][il; 


*pmonth = i; 


*pday = yearday; 
} 


我 们 在 前 面 的 章节 中 曾 讲 过 ， 逻 辑 表达 式 的 算术 运算 值 只 可 能 是 O(N 
假 时 ) 或 者 1( 为 真 时 )。 因此， 在 本 例 中 ， 可 以 将 逻辑 表达 式 leap 用 做 
数组 daytab 的 下 标 。 


数组 daytab 必须 在 函数 day_of_year 和 month_day 的 外 部 进行 声明 ， 
这 样 ， 这 两 个 函数 都 可 以 使 用 该 数组 。 这 里 之 所 以 将 daytab 的 元 素 声 
明 为 char 类 型 ， 是 为 了 说 明 在 char 类 型 的 变量 中 存放 较 小 的 非 字 符 整 
数 也 是 合法 的 。 


到 目前 为 止 ，daytab 十 我 们 遇 到 的 第 一 个 二 维 数 组 。 在 C 语言 中 ， 二 
维 数组 实际 上 是 一 种 特殊 的 一 维 数组 ， 它 的 每 个 元 素 也 十 一 个 一 维 数 
组 。 因 此 ， 数 组 下 标 应 该 写成 


daytab[i][j] /* [row][col] */ 
而 不 能 写成 
daytab[i,j] /* WRONG */ 


除了 表示 方式 的 区 别 外 ，C 语言 中 二 维 数组 的 使 用 方式 和 其 它 语言 一 
样 。 数 组 元 素 按 行 存储 ， 因 此 ， 当 按 存储 顺序 访问 数组 时 ， 最 右边 的 
数组 下 标 ( 即 列 ) 变 化 得 最 快 。 


数组 可 以 用 花 括 号 括 起 来 的 初 值 表 进 行 初 始 化 ， 二 维 数组 的 每 一 行 由 

相应 的 子 列表 进行 初始 化 。 在 本 例 中 ， 我 们 将 数组 daytab 的 第 一 列 元 
素 设置 为 0， 这 样 ， 月 份 的 值 为 1@12， 而 不 是 0@11。 由 于 在 这 里 存 
ee 所 以 这 种 处 理 方式 比 在 程序 中 调整 数组 的 下 
IKE IHX ° 


如 有 果 将 二 维 数 组 作为 参数 传递 给 函数 ， 那 么 在 函数 的 参数 声明 中 必须 
指明 数组 的 列 数 。 数 组 的 行 数 没有 太 大 关系 ， 因 为 前 面 已 经 讲 过 ， 配 
数 调用 时 传递 的 是 一 个 指针 ， 它 指 加 由 行 癌 量 构成 的 一 维 数 组 ， 其 中 
每 个 行 向 量 古 具有 13 个 整 型 元 素 的 一 维 数组 。 在 该 例子 中 ， 传 递 


给 函数 的 是 一 个 指 同 很 多 对 象 的 指针 ， 其 中 每 个 对 象 是 由 13 个 整 型 元 
素 构 成 的 一 维 数 组 。 因 此 ， 如 有 果 将 数组 daytab 作为 参数 传递 给 函数 

f， 那 么 ff 的 声明 应 该 写成 下 列 形式 : 

f(int daytab[2][13]) { ... } 

也 可 以 写成 

f(int daytab[][13]) { ... } 

因为 数组 的 行 数 无 天 紧要 ， 所 以 ， 该 声明 还 可 以 写成 

f(int (*daytab)[13]) { ... } 

这 种 声明 形式 表明 参数 是 一 个 指针 ， 它 指向 具有 13 个 整 型 元 素 的 一 维 
数组 。 因 为 方 括号 [的 优先 级 高 于 * 的 优先 级 ， 所 以 上 壕 声 明 中 必须 使 
用 圆 括号 。 如 果 去 掉 括 号 ， 则 声明 变 成 

int *daytab[13] 

这 相当 于 声明 了 一 个 数组 ， 该 数组 有 13 个 元 素 ， 其 中 每 个 元 又 都 是 一 
个 指 同 整 型 对 象 的 指针 。 一 般 来 说 ， 除 数组 的 第 一 维 (下 标 ) 可 以 不 指 
定 大 小 外 ， 其 余 各 维 都 必须 明确 指定 大 小 。 

我 们 将 在 5.12 市 中 进一步 讨论 更 复杂 的 声明 。 


练习 5"8 函数 day_of_year 和 month_day 中 没有 进行 错误 检查 ， 
请 解决 该 问题 。 


5.8 指针 数组 的 初始 化 


考虑 这 样 一 个 问题 :编写 一 个 函数 month_name(n)， 它 返回 一 个 指 癌 第 
n 个 月 名 字 的 字符 串 的 指针 。 这 是 内 部 static 类 型 数组 的 一 种 理想 的 
应 用 。month_name 函数 中 包含 一 个 私有 的 字符 串 数 组 ， 当 它 被 调用 
返回 一 个 指向 正确 元 素 的 指针 。 本 市 将 说 明 如 何 初 始 化 该 名 字数 
组 。 

名 数组 的 初始 化 语法 和 前 面 所 讲 的 其 它 类 型 对 象 的 初始 化 语法 类 似 : 


/* month name: return name of neth month */ char 
*month_name(int n) 


{ 

static char *name[] = { "Illegal month", 

"January", "February", "March", 

"April", "May", "June", 

"July", "August", "September", "October", "November", "December" 

} 

其 中， name 的 声 明 与 排序 例子 中 lineptr 的 声 明 相 同 ， 和 是 一 个 一 维 数 
组 ， 数 组 的 元 素 为 字 符 指针 。name 数组 的 初始 化 通过 一 个 字符 串 列 
表 实 现 ， 列 表 中 的 每 个 字符 串 赋 值 给 数组 相应 位 置 的 元 素 。 第 i 个 字 
符 串 的 所 有 字符 存储 在 存储 絮 中 的 某 个 位 置 ， 指 同 它 的 指针 存储 在 


name[i] 中 。 由 于 上 述 声 明 中 没有 指明 name 的 长 度 ， 因 此 ， 编 译 需 编 
译 时 将 对 初 值 个 数 进 行 统 计 ， 并 将 这 一 准确 数字 填 入 数组 的 长 度 。 


5.9 指针 与 多 维 数 组 


对 于 C 语言 的 初学 者 来 说 ， 很 容易 混 清 二 维 数组 与 指针 数组 之 间 的 区 
别 ， 比 如 上 面 例 子 中 的 name。 假 如 有 下 面 两 个 定义 : 


int a[10][20]; int *b[ 10]; 


那么 ， 从 语法 角度 讲 ，a[3][4] 和 b[3][4] 都 是 对 一 个 int 对 象 的 合法 引 
用 。 但 a 是 一 个 真正 的 二 维 数 组 ， 它 分 配 了 200 个 int 类 型 长 度 的 存 
储 空 间 ， 并 且 通 过 常规 的 矩阵 下 标 计算 公式 20xrow+col( 其 中 ，row 
表示 行 ，col 表示 列 ) 计 算得 到 元 素 a[row]j[col] 的 位 置 。 但 是 ， 对 b 来 
说 ， 该 定义 仅仅 分 配 了 10 个 指针 ， 并 且 没 有 对 它们 初始 化 ， 它 们 的 初 
始 化 必须 以 显 式 的 方式 进行 ， 比 如 静态 初始 化 或 通过 代码 初始 化 。 假 
E b 的 每 个 元 素 都 指向 一 个 具有 20 个 元 BAA, ADA Sie as 
为 它 分 配 200 个 int 类 型 长 度 的 存储 空间 以 及 10 个 指针 的 存储 空间 。 
指针 数组 的 一 个 重要 优点 在 于 ， 数 组 的 每 一 行 长 度 可 以 不 同 ， 世 就 是 
说 ，b 的 每 个 元 素 不 必 都 指向 一 个 具有 20 个 元 素 的 疝 量 ， 菜 些 元 素 可 
以 指 回 具有 2 个 元 素 的 辣 量 ， 某 些 元 素 可 以 

指 癌 具有 50 个 元 素 的 同 量 ， 而 某 些 元 素 可 以 不 指向 任何 癌 量 。 

尽管 我 们 在 上 面 的 讨论 中 都 是 借助 于 整 型 进行 讨论 ， 但 到 目前 为 止 ， 
指针 数组 最 频繁 的 用 处 是 存放 具有 不 同 长 度 的 字符 串 ， 比 如 函数 
month_name 中 的 情况 。 结 合 下 面 的 声明 和 图 形 化 描述 ， 我 们 可 以 做 
一 个 比较 。 下 面 是 指针 数组 的 声明 和 图 形 化 描述 (参见 图 5.9): 


char *name[]={"Illegal manth", "Jan", "Feb", "Mar"}; 


name: 
I Illegal month\0 | 
ae! 
Fro 


5°9 
下 面 是 二 维 数组 的 声明 和 图 形 化 描述 (参见 图 5.10): 


char aname[][15] = { "Illegal month", "Jan", "Feb", "Mar" }; 


anane: 
[Illegal month} 0 Jan\0 Feb\o Maro 
6 is 20 as 
5°10 


练习 5°9 用 指针 方式 代 奉 数组 下 标 方式 改写 函数 day_of_year 和 
month_day ° 


5.10 命令 行 参 数 


在 文 持 C 语言 的 环境 中 ， 可 以 在 程序 开始 执行 时 将 命令 行 参数 传递 给 
程序 。 调 用 主 函 数 main 时 ， 它 之 有 两 个 参数 。 第 一 个 参数 (习惯 上 称 
为 argc， 用 于 参数 计数 ) 的 值 表示 运行 程序 时 命令 行 中 参数 的 数目 ;第 
二 个 参数 ( 称 为 argv， 用 于 参数 向 量 ) 是 一 个 指向 字符 串 数 组 的 指针 ， 
其 中 每 个 字符 串 对 应 一 个 参数 。 我 们 通常 用 多 级 指针 处理 这 些 字 符 


最 简单 的 例子 古 程 订 echo， 它 将 命令 行 参数 回 显 在 屏 医 上 的 一 行 中 ， 
其 中 命令 行 中 各 参数 之 间 用 空格 阳 开 。 也 区 ® 是 说 ， 命 令 


echo hello, world 


将 打印 下 列 输出 : 


hello, world 


按照 C 语言 的 约定 ，argv[0] 的 值 是 启动 该 程序 的 程序 名 ， 因 此 arge 的 
值 至 少 为 1。 如果 argc 的 值 为 1， 则 说 明 程 序 名 后 面 没有 命令 行 参 
数 。 在 上 面 的 例子 中 ，argc 的 值 为 3，argv[0]、argv[1] 和 argv[2] 的 值 
分 别 为 “echo"、“ hello,"， 以 及 “world"。 第 一 个 可 选 参 数 为 
argv[1]， 而 最 后 一 个 可 选 参数 为 argv[argc*1]。 男 外 ，ANSI 标准 要 求 
argv[argc] 的 值 必 须 为 一 空 指针 (参见 图 5°11) ° 


argv: 


e— hello, \0 | 
o> —>|world\o_ 


0 


图 5°11 
程序 echo 的 第 一 个 版 本 将 argv 看 成 是 一 个 字符 指针 数组 : 
#include <stdio.h> 


/* echo commandsline arguments; 1st version */ main(int argc, char 


*argv[]) 

{ 

int i; 

for (i = 1; i < argc; i++) 

printf("%s%s", argv[i], (i < argce1) ? " " : ""); printf("\n"); 

return 0; 

} 

因为 argv 是 一 个 指 癌 指 计数 组 的 指针 ， 所 以 ， 可 以 通过 指针 而 非 数组 
下 标的 方式 处 理 命令 行 参数 。echo 程序 的 第 二 个 版 本 是 在 对 argv 进 
行 目 增 运算 、 对 argc 进行 自 减 运算 的 基础 上 实现 的 ， 其 中 argv 是 一 
个 指向 char 类 型 的 指针 的 指针 : 


#include <stdio.h> 


/* echo commandsline arguments; 2nd version */ main(int argc, char 


*argv[]) 

{ 

while ( "argc > 0) 

printf("%s%s", *++argv, (argc > 1)?" ":""); printf("\n"); 


return 0; 


} 

因为 argv 是 一 个 指向 参数 字符 串 数组 起 始 位 置 的 指针 ， 所 以 ， 自 增 运 
算 (++argv) 将 使 得 它 在 最 开始 指 疝 argv[1] 而 非 argv[0]。 每 执行 一 次 目 
增 运 算 ， 束 使 得 argv 指向 下 一 个 参数，*argv 就 是 指 癌 那个 参数 的 指 
针 。 与 此 同时 ，argc 执行 自 减 运算 ， 当 它 变 成 0 时 ， 束 完成 了 所 有 参 
数 的 打印 。 

也 可 以 将 printf 语句 写成 下 列 形式 : 


printf((argc > 1) ? "%s " : "%s”, *++argv); 


AHH, printf 的 格式 化 参数 也 可 以 是 表达 式 。 我 们 来 看 第 二 个 例 
子 。 在 该 例子 中 ， 我 们 将 增强 4.1 市 中 模式 查找 程序 的 功能 。 在 4.1 市 


中 ， 我 们 将 查找 模式 内 置 到 程序 中 了 ， 这 种 解决 方法 显然 不 能 令 人 满 
意 。 下 面 我 们 来 效仿 UNIX 


程序 grep 的 实现 方法 改写 模式 得 找 程序 ， 通 过 命令 行 的 第 一 个 参数 指 
定 竺 匹配 的 模式 。 


#include <stdio.h> 

#include <string.h> 

#define MAXLINE 1000 

int getline(char *line, int max); 


/* find: print lines that match pattern from 1st arg */ main(int argc, 
char *argv[]) 


{ 


char line[ MAXLINE]; 


int found = 0; 

if (argc != 2) 

printf(""Usage: find pattern\n"); else 

while (getline(line, MAXLINE) > 0) 

if (strstr(line, argv[1]) != NULL) { printf("%s", line); 

found++; 

} 

return found; 

} 

Pie Fe EN SY strstr(s, t) 返 回 一 个 指针 ， 该 指针 指 问 字符 串 t EFIE s 
中 第 一 次 出 现 的 位 置 ;如 果 字 符 串 t 没 有 在 字符 串 s PH, KAGE 
NULL( 空 指针 )。 该 函数 声明 在 头 文 件 <string.h> 中 。 

为 了 更 进一步 地 解释 指针 结构 ， 我 们 来 改进 模式 查找 程序 。 假 定 允 许 
程序 带 两 个 可 选 参 数 。 其 中 一 个 参数 表示 "打印 除 匹配 模式 之 外 的 所 
有 行 "， 另 一 个 参数 表示 "每 个 打印 的 文本 行 前 面 加 上 相应 的 行 号 "。 
UNIX 系统 中 的 C 语言 程序 有 一 个 公共 的 约定 :以 负 号 开头 的 参数 表示 


一 个 可 选 标志 或 参数。 假定 用 .x( 代 表 '" 除 .……. 之 外 ") 表 示 打 印 所 有 与 
异 式 个 还 配 的 文本 行 ， 用 n( 代 表 " 行 号 ") 表 示 打 印行 号 ， 那 么 下 列 合 
a 


find x en 模式 将 打印 所 有 与 模式 不 匹配 的 行 ， 并 在 每 个 打印 行 的 前 面 
EEIT 
可 选 参数 应 该 允许 以 任意 次 序 出 现 ， 同 时 ， 程 序 的 其 余部 分 应 该 与 命 


令 行 中 参数 的 数目 无 大。 此 外 ， 如 有 果 可 选 参数 能 够 组 合 使 用 ， 将 会 给 
使 用 者 市 来 更 大 的 方便 ， 比 如 : 


find enx 模式 改写 后 的 模式 查找 程序 如 下 所 示 : 
#include <stdio.h> 

#include <string.h> 

#define MAXLINE 1000 

int getline(char *line, int max); 


/* find: print lines that match pattern from 1st arg */ main(int argc, char 
*argv[]) 


{ 

char line[MAXLINE]; long lineno = 0; 

int c, except = 0, number = 0, found = 0; 

while (**argc > 0 && (*++argv)[0] == '*') while (c = *++argv[0]) 
switch (c) { case 'x': 

except = 1; break; 

case 'n': 


number = 1; 


break; default: 

printf("find: illegal option %c\n", c); argc = 0; 

found = °1; break; 

} 

if (argc != 1) 

printf("Usage: find «x en pattern\n"); else 

while (getline(line, MAXLINE) > 0) { lineno++; 

if ((strstr(line, *argv) != NULL) != except) { if (number) 

printf("%ld:", lineno); 

printf("%s", line); found++; 

} 

} 

return found; 

} 

在 处 理 每 个 可 选 参数 之 前 ，argc PUT AGAR, argv 执行 目 增 运算 。 
循环 语句 结束 时 ， 如 采 没 有 错误 ， 则 arge 的 值 表示 还 没有 处 理 的 参数 
数目 ， 而 argv 则 指向 这 些 未 处 理 参数 中 的 第 一 个 参数 。 因 此 ， 这 时 
argc 的 值 应 为 1， 而 *argv 应 该 指 癌 模式 。 注 意 ，*++targv 是 一 个 指 问 
参数 字符 串 的 指引 ， 因 此 (*++argv)[0] 是 它 的 第 一 个 字符 ( 男 一 种 有 效 
形式 走 

**++argV)。 因 为 [与 操作 数 的 结合 优先 级 比 * 和 ++ 高 ， 所 以 在 上 述 表 达 


式 中 必须 使 用 圆 括 号 ， 否 则 编译 侨 将 会 把 该 表达 式 当做 *++(argv[0])。 
实际 上 ， 我 们 在 内 层 循 环 中 束 使 用 了 表达 式 *++argv[0]， 其 目的 是 志 


历 一 个 特定 的 参数 串 。 在 内 层 循环 中 ， 表 达 式 *++argv[0] 对 指针 
argv[0] 进 行 了 目 增 运算 。 


很 少 有 人 使 用 比 这 更 复杂 的 指针 表达 式 。 如 采 遇 到 这 种 情况 ， 可 以 将 
它们 分 为 两 步 或 三 步 来 理解 ， 这 样 会 更 直观 一 些 。 


练习 5°10 编写 程序 expr， 以 计算 从 命令 行 输入 的 敢 波 三 表达 式 
的 值 ， 其 中 每 个 运算 符 或 操作 数 用 一 个 单独 的 参数 表示 。 例 如 ， 命 令 


expr234+* 

将 计算 表达 式 x (3 + 4) 的 值 。 

练习 5°11 修改 程序 entab 和 decab( 1 2% PARAS AKRO , 
使 它们 接受 一 组 作 为 参数 的 制 表 符 集 止 位 。 如 果 启 动 程 序 时 不 带 参 
数 ， 则 使 用 默认 的 制 表 符 停止 位 设置 。 


练习 5°12 对 程序 entab 和 detab 的 功能 做 一 些 扩充 ， 以 接受 下 
列 缩写 的 命令 : 


entab —m +n 


表示 制 表 符 从 第 m 列 开始 ， 每 隔 n 列 停止 。 选 择 ( 对 使 用 者 而 言 ) 比 较 
方便 的 默认 行为 。 练 习 5°13 编写 程序 tail， 将 其 输入 中 的 最 后 
n 行 打印 出 来 。 默 认 情 况 下 ，n 的 值 为 

10， 但 可 通过 一 个 可 选 参数 改变 n 的 值 ， 因 此 ， 命 令 


tail en 


将 打印 其 输入 的 最 后 n 行 。 无 论 输 入 或 n 的 值 是 否 合理 ， 该 程序 都 应 
该 能 正 第 运行 。 编 


写 的 程序 要 充分 地 利用 存储 空间 ;输入 行 的 存储 方式 应 该 同 5.6 市 中 排 
序 程序 的 存储 方式 一 样 ， 而 不 采用 固定 长 度 的 二 维 数组 。 


5.11 指 同 画 数 的 指针 


在 C 语言 中 ， 函 数 本 号 不 是 变量 ， 但 可 以 定义 指 回 画 数 的 指针 。 这 种 
类 型 的 指针 可 以 被 赋值 、 存 放 在 数组 中 、 传 递 给 函数 以 及 作为 函数 的 
返回 值 等 等 。 为 了 说 明 指 向 函数 的 指针 的 用 法 ， 我 们 搂 下 来 将 修改 本 
章 前 面 的 排序 范 数 ， 在 给 定 可 过 参数 "n 的 情况 下 ， 该 函数 将 按 数 值 大 
小 而 非 字 上 典 顺序 对 输入 行进 行 排 序 。 


排序 程序 通常 包括 3 部 分 :判断 任何 两 个 对 象 之 间 次 序 的 比较 操作 、 疲 
倒 对 象 次 序 的 交 换 操作 、 一 个 用 于 比较 和 交换 对 和 象 直 到 所 有 对 和 象 都 按 
正确 次 序 排列 的 排序 算法 。 由 于 排 友 算 法 与 比较 、 交 换 操作 无 天 ， 
此 ， 通 过 在 排序 算法 中 调用 不 同 的 比较 和 交换 函数 ， 便 可 以 实 现 按 照 
不 同 的 标准 排序 。 这 束 是 我 们 的 新 版 本 排序 函数 所 采用 的 方法 。 


RIEBE, KET strcmp 按 字典 顺序 比较 两 个 输入 行 。 在 这 里 ， 
我 们 还 需要 一 个 以 数值 为 基础 来 比较 两 个 输入 行 ， 并 返回 与 strcmp 同 
样 的 比较 结果 的 函数 numcmp。 这 些 函 数 在 main 之 前 声明 ， 并 且 ， 指 
癌 恰当 函数 的 指针 将 被 传递 给 qsort 函数 。 在 这 里 ， 人 参数 的 出 错 处 理 
并 不 是 问题 的 重点 ， 我 们 将 主要 考虑 指 同 函数 的 指针 问题 。 


#include <stdio.h> 


#include <string.h> 


#define MAXLINES 5000 /* max #lines to be sorted */ char 
*lineptr: MAXLINES]; /* pointers to text lines */ 


int readlines(char *lineptr[], int nlines); void writelines(char *lineptr[], int 
nlines); 


void qsort(void *lineptr[], int left, int right, int (*comp)(void *, void *)); 


int numcmp(char *, char *); 


/* sort input lines */ main(int argc, char *argv[]) 
{ 


int nlines; /* number of input lines read */ int numeric = 0; 
/* 1 if numeric sort */ 


if (argc > 1 && strcmp(argv[1], "*n") == 0) numeric = 1; 


if ((nlines = readlines(lineptr, MA XLINES)) >= 0) { qsort((void**) lineptr, 
0, nlinese1, 


(int (*)(void*,void*))(numeric ? numcmp : strcmp)); writelines(lineptr, 
nlines); 


return 0; 

} else { 

printf("input too big to sort\n"); return 1; 
} 

} 


在 调用 函数 qsort 的 语句 中 ，strcmp 和 numcmp 是 函数 的 地 址 。 因 为 它 
们 是 函数 ， 所 


以 前 面 不 需要 加 上 取 地 址 运算 符 &， 同 样 的 原因 ， 数 组 名 前 面 也 不 需 


要 & 运 算 符 。 


改写 后 的 qsort 函数 能 够 处 理 任何 数据 类 型 ， 而 不 仅仅 限于 字符 串 。 从 
函数 qsort 的 原型 可 以 看 出 ， 它 的 参数 表 包 括 一 个 指针 数组 、 两 个 整 
数 和 一 个 有 两 个 指针 参数 的 函数 。 其 中 ， 指 针 数 组 参数 的 类 型 为 通用 
指针 类 型 void *。 由 于 任何 类 型 的 指针 都 可 以 转换 为 void 


* 类 型 ， 并 且 在 将 它 转换 回 原来 的 类 型 时 不 会 丢失 信息 ， 所 以 ， 调 用 
qsort KAUT T NES SURER void * 类 型 。 比 较 画 数 的 参数 也 要 
执行 这 种 类 型 的 转换 。 这 种 转换 通常 不 会 影 响 到 数据 的 实际 表示 ， 但 
要 确保 编译 器 不 会 报错 。 


/* qsort: sort v[left]...v[right] into increasing order */ void 
qsort(void *v[], int left, int right, 


int (*comp)(void *, void *)) 
{ 

int i, last; 

void swap(void *v[], int, int); 


if (left >= right) /* do nothing if array contains */ 
return; /* fewer than two elements */ 


swap(vy, left, (left + right)/2); last = left; 

for (i = left+1; i <= right; i++) if (*comp)(vLi], v[left]) < 0) 
swap(v, ++last, i); swap(v, left, last); 

qsort(v, left, laste1, comp); qsort(v, last+1, right, comp); 

} 

我 们 仔细 研究 一 下 其 中 的 声明 。gsort 函数 的 第 四 个 参数 声明 如 下 : 


int (*comp)(void *, void *) 


它 表 明 comp — AKAA, AKARA AA void * 类 型 的 参 
数 ， 其 返回 值 类 型 为 int。 


在 下 列 语句 中 : 
if ((*comp)(v[i], v[left]) < 0) 


comp 的 使 用 和 其 声明 十 一 致 的 ，comp &— Th fall KATSET, 
*comp 代表 一 个 范 数 。 下 列 Ta Ale EK BOAT Val A: 


(*comp)(v[i], v[left]) 


其 中 的 圆 括号 是 必须 的 ， 这 样 才能 够 保证 其 中 的 各 个 部 分 正确 结合 。 
如 条 没有 括号 ， 例 如 写 成 下 面 的 形式 : 


int *comp(void *, void *) /* WRONG */ 


则 表明 comp 是 一 个 函数 ， 该 函数 返回 一 个 指 回 int 类 型 的 指针 ， 这 同 
我 们 的 本 意 显 然 有 很 大 的 差别 。 

我 们 在 前 面 讲 过 函数 srcmp， 占 用 于 比较 两 个 字符 串 。 这 里 介绍 的 函 
数 numemp 也 是 比 较 两 个 字符 串 ， 但 它 通过 调用 atof 计算 字符 串 对 应 
的 数值 ， 然 后 在 此 基础 上 进行 比较 : 


#include <stdlib.h> 


/* numcmp: compare s1 and s2 numerically */ int numcmp(char 
*s1, char *s2) 


{ 

double v1, v2; 

v1 = atof(s1); v2 = atof(s2); if (v1 < v2) 
return °1; else if (v1 > v2) 

return 1; else 

return 0; 

} 


交换 两 个 指引 的 swap 函数 和 本 草 前 面 所 述 的 swap 函数 相同 ， 但 它 的 
参数 声明 为 void * 


void swap(void *v[], int i, int j;) 
{ 

void *temp; 

temp = v[i]; vli] = vlj]; v[j] = temp; 

} 


oe 以 将 其 它 一 些 选 页 增加 到 排序 程序 中 ， 有 些 可 以 作为 较 难 的 练 


练习 5°14 修改 排序 程序 ， 使 它 能 处 理 *r 标记 。 该 标记 表明 ， 以 逆序 
(递减 ) 方 式 排序 。 要 保证 r 和 on 能 够 组 合 在 一 起 使 用 。 


练习 5°15 增加 选 页 .f， 使 得 排序 过 程 不 考虑 字母 大 小 写 之 间 的 
区 别 。 例 如 ， 比 较 a 


和 A 时 认为 它们 相等 。 


练习 5916 增加 选 页 *d( 代 表 目 录 顺 序 )。 该 选 页 表明 ， 只 对 了 字母、 数字 
和 空格 进行 比较。 要 保证 该 选 页 可 以 和 of 组 合 在 一 起 使 用 。 


练习 5°17 增加 字段 处 理 功能 ， 以 使 得 排序 程序 可 以 根据 行内 的 不 同 字 
段 进行 排序 ， 每 个 字段 按照 一 个 单独 的 选 页 集合 进行 排序 。( 在 对 本 
书 索引 进行 排序 时 ， 索 引 条 目 使 用 了 .df 选 页 ， 而 对 页 码 排 序 时 使 用 了 


en WH e) 


5.12 复杂 声明 


C 语言 常 利 因为 声明 的 语法 问题 而 受到 人 们 的 批评 ， 特 别 是 涉及 到 画 
数 指针 的 语法 。C 语 言 的 语法 力图 使 声明 和 使 用 相 一 致 。 对 于 简单 的 
情况 ，C 语言 的 做 法 是 很 有 效 的 ， 但 是 ， 如 果 TIRE, WAZ 
让 人 人 混淆， 原因 在 于 ，C 语言 的 声明 不 能 从 左 至 右 阅 读 ， 而 且 使 用 了 
K 多 的 圆 括号 。 我 们 来 看 下 面 所 示 的 两 个 声明 : 


int *f(); /* f: function returning pointer to int */ 


以 及 


int (*pf)Q; /* pf: pointer to function returning int */ 


ENN ZILA SCA Ae PS OBES, ECBO). AT 
以 ， 声 明 中 必须 使 用 圆 7S DRE BI o 


尽管 实际 中 很 少 用 到 过 于 复杂 的 声明 ， 但 是 ， 惟 得 如 何 理解 甚至 如 何 
使 用 这 些 复杂 的 声 明 是 很 重要 的 。 如 何 创 建 复 杂 的 声明 了 昵 ?一 种 比较 
好 的 方法 是 ， 使 用 typedef 通过 简单 的 步 又 合成 ， 这 种 方法 我 们 将 在 
6.7 市 中 讨论 。 这 里 介绍 男 一 种 方法 。 接 下 来 讲述 的 两 个 程序 束 使 用 
这 种 方法 :一 个 程序 用 于 将 正确 的 C 语言 声明 转换 为 文字 描述 ， 另 一 个 
程序 完成 相反 的 转换 。 文 字 摘 述 是 从 左 至 右 阅读 的 。 


第 一 个 程序 dd 复杂 一 些 。 它 将 C 语言 的 声明 转换 为 文字 描述 ， 比 如 : 


char **argv 


argv: pointer to char int (*daytab)[13] 
daytab: pointer to array[13] of int int *daytab[13] 
daytab: array[13] of pointer to int void *comp() 


comp: function returning pointer to void void (*comp)() 

comp: pointer to function returning void char (*(*xQ)L)Q 

x: function returning pointer to array[] of pointer to function returning char 
char (*(*x[3])Q)[5] 

x: array[3] of pointer to function returning pointer to array[5] of char 


程序 del ÆT E HRERS o Bio A 以 及 8.5 TRAE HI 
的 语法 进行 详细 的 描述 。 下 面 是 其 简化 的 语法 形式 : 


dcl: optional *'s directedcl directedcl name 


(dcl) directedclQ) 


directedcl[optional size] 


HELZ, EIF del 就 是 前 面 可 能 带 有 多 个 * 的 directedcl © directedcl 
可 以 是 name、 由 一 对 圆 括号 括 起 来 的 dcl、 后 面 跟 有 一 对 圆 括号 的 
directedcl、 后 面 跟 有 用 方 括 号 括 起 来 的 表示 可 选 长 度 的 direct*dcl。 


该 语法 可 用 来 对 C 语言 的 声明 进行 分 析 。 例 如 ， 考 虚 下 面 的 声明 符 : 
(*pfal])O 


按照 该 语法 分 析 ，pfa 将 被 识别 为 一 个 name， 从 而 被 认为 是 一 个 
direct*dcl。 于 是 ，pfa[] 也 是 一 个 direct*dcl。 接 着 ，*pfa[] 被 识别 为 一 
个 dcl， 因 此 ， 判 定 (*pfa[) 是 一 个 direct*dcl。 再 接着 ，(*pfa[)O 被 识 
别 为 一 个 directsdcl， 因 此 也 是 一 个 dcl。 可 以 用 图 5°12 所 示 的 语法 分 
析 树 来 说 明 分 析 的 过 程 (其 中 direct*dcl 缩写 为 diredcl)。 


( + pia c > Q 


name 4 
dir-del 


dir-del 
del 

dir-del 

dir-del 


dci 


5°12 


程序 dcl 的 核心 是 两 个 函数 :dal 与 dirdcl， 它 们 根据 声明 符 的 语法 对 声 
明 进 行 分 析 。 因为 语法 是 递归 定义 的 ， 所 以 在 识别 一 个 声明 的 组 成 部 
分 时 ， 这 两 个 函数 是 相互 递归 调用 的 。 我 们 称 该 程序 是 一 个 递归 下 降 
语法 分 析 程 序 。 


/* del: parse a declarator */ void dcl(void) 
{ 

int ns; 

for (ns = 0; gettoken() == '*'; ) /* count *'s */ ns++; 
dirdcl(); 


while (nsee > 0) 


strcat(out, " pointer to"); 


} 


/* dirdcl: parse a direct declarator */ void dirdcl(void) 
{ 

int type; 

if (tokentype == '(‘) { /* (del ) */ dcelQ; 


if (tokentype != ')') printf("error: missing )\n"); 


} else if (tokentype == NAME) /* variable name */ strcpy(name, 
token); 


else 
printf("error: expected name or (dcl)\n"); 


while ((type=gettoken()) == PARENS || type == BRACKETS) if (type == 
PARENS) 


strcat(out, " function returning"); 


else { 
strcat(out, " array"); strcat(out, token); strcat(out, " of"); 

} 

} 
该 程序 的 目的 由 在 说 明 问 题 ， 并 不 想 做 得 尽善尽美 ， 所 以 对 del 有 很 
多 限制 ， 它 只 能 处 理 类 似 于 char 或 int 这 样 的 简单 数据 类 型 ， 而 无 法 
处 理 函 数 中 的 参数 类 型 或 类 似 于 const 这 样 的 限定 符 。 它 不 能 处 理 带 
有 不 必要 空格 的 情况 。 由 于 没有 完备 的 出 错 处 理 ， 因 此 它 也 无 法 处 理 
无 效 的 声明 。 这 些 方面 的 改进 留 给 读者 做 练习 。 

下 面 是 该 程序 的 全 局 变量 和 主 程 序 : 


#include <stdio.h> 


#include <string.h> 

#include <ctype.h> 

#define MAXTOKEN 100 

enum { NAME, PARENS, BRACKETS }; 
void dcl(void); void dirdcl(void); 

int gettoken(void); 


int tokentype; /* type of last token */ char token[MAXTOKEN]; /* last 
token string */ char name[MAXTOKEN]; /* identifier name */ 


char datatype[MAXTOKEN]; /* data type = char, int, etc. */ char 
out[ 1000]; 


main() /* convert declaration to words */ 


{ 


while (gettoken() != EOF) { /* 1st token on line */ strcpy(datatype, 
token); /* is the datatype */ out[0] = '\0'; 
dclQ; /* parse rest of line */ if (tokentype != ^n’) 


printf("syntax error\n"); 

printf("%s: %s %s\n", name, out, datatype); 

} 

return 0; 

} 

函数 gettoken 用 来 跳 过 空格 与 制 表 符 ， 以 查找 输入 中 的 下 一 个 记 
号 。" 记 号 "(token) 可 以 是 一 个 名 字 ， 一 对 圆 括号 ， 可 能 包含 一 个 数字 
的 一 对 方 括号 ， 也 可 以 是 其 它 任何 单个 字符 。 

int gettoken(void) /* return next token */ 

{ 

int c, getch(void); void ungetch(int); char *p = token; 


while ((c = getch()) == '' || c == t’) 


IC {1 

if ((c = getch()) ==')') { 

strcpy(token, "()"); return tokentype = PARENS; 
} else { 

ungetch(c); 

return tokentype = '(’; 

} 

} else if (c == T) { 

for (*p++ = c; (*pt++ = getch()) != 小 ; ) 
*p = 10; 

return tokentype = BRACKETS; 

} else if (isalpha(c)) { 

for (*p++ = c; isalnum(c = getch()); ) 
*p++ 二 C; 

*p = '\0'; ungetch(c); 

return tokentype = NAME; 

} else 

return tokentype = c; 


} 


AKEKE getch 和 ungetch 的 说 明 ， 参 见 第 4 章 。 如 果 不 在 乎 生成 多 
余 的 圆 括号 ， 另 一 个 方向 的 转换 要 容易 一 些 。 为 了 人 簿 化 程序 的 输入 ， 


我 们 将 “x is a function returning a pointer to an array of pointers to 
functions returning char"(x 是 


一 个 函数 ， 它 返回 一 个 指针 ， 该 指针 指向 一 个 一 维 数 组 ， 该 一 维 数 组 
的 元 素 为 指针 ， 这 些 指 EO RIS SR, DEAR A 
char 类 型 ) 的 描述 用 下 列 形式 表示 : 

x Q * [] * 0 char 

程序 undcl 将 把 该 形式 转换 为 : 

char (*(*xQ)LDO 


由 于 对 输入 的 语法 进行 了 人 简化， 所 以 可 以 重用 上 面 定义 的 gettoken Ex 
Z © undcl 和 del 


使 用 相同 的 外 部 变量 。 


/* undcl: convert word descriptions to declarations */ main() 
{ 

int type; 

char temp[MAXTOKEN]; 


while (gettoken() != EOF) { strcpy(out, token); 

while ((type = gettoken()) != '\n’) 

if (type == PARENS || type == BRACKETS) strcat(out, token); 
else if (type == '*') { sprintf(temp, "(*%s)", out); strcpy(out, temp); 


} else if (type == NAME) { sprintf(temp, "%s %s", token, out); strcpy(out, 
temp); 


} else 


} 

return 0; 

} 

printf("invalid input at %s\n", token); 

练习 5°18 修改 del 程序 ， 使 它 能 够 处 理 输入 中 的 错误 。 


练习 5°19 修改 undcl 程序 ， 使 它 在 把 文字 描述 转换 为 声明 的 过 
程 中 不 会 生成 多 余 的 圆 括号 。 


练习 5.20 扩展 dd 程序 的 功能 ， 使 它 能 够 处 理 包含 其 它 成 分 的 
吉明 ， 例 如 带 有 函数 参数 类型 的 声明 、 带 有 类 似 于 const 限定 符 的 声 
明 等 。 


第 6 章 结构 


结构 是 一 个 或 多 个 变量 的 集合 ， 这 些 变量 可 能 为 不 同 的 类 型 ， 为 了 处 
理 的 方便 而 将 这 些 变量 组 织 在 一 个 名 字 之 下 。( 某 些 语言 将 结构 称 
为 "记录 "， 比 如 Pascal 语言 。) 由 于 结构 将 一 组 相关 的 变量 看 作 一 个 音 
元 而 不 是 各 自 独立 的 实体 ， 因 此 结构 有 助 于 组 织 复杂 的 数据 ， 特 别 是 
在 大 型 的 程序 中 。 


质 记 录 十 用 来 描述 结构 的 一 个 传统 例子 。 每 个 雇员 由 一 组 属性 描 
述 ， 如 姓名 、 地 址 、 社 会 保险 号 、 工 资 等 。 其 中 的 某 些 属 性 也 可 以 是 
结构 ， 例 如 姓名 可 以 分 成 几 部 分 ， 地 址 甚至 工资 也 可 能 出 现 类 似 的 情 
况 。C 语言 中 更 典型 的 一 个 例 于 来 目 于 图 形 领域 :点 由 一 对 坐标 定义 ， 
和 窍 形 由 两 个 点 定义 ， 等 等 。 


ANSI 标准 在 结构 方面 最 主要 的 变化 是 定义 了 结构 的 赋值 操作 一 一 结 
构 可 以 找 贝 、 赂 值 、 传 递 给 函数 ， 画 数 也 可 以 返回 结构 类 型 的 返回 

值 。 多 年 以 前 ， 这 一 操作 就 已 经 被 大 多 数 的 编 译 各 所 文 持 ， 但 是 ， 直 
到 这 一 标准 才 对 其 属性 进行 了 精确 定义 。 在 ANSI 标准 中 ， 目 动 结构 
和 数组 现在 也 可 以 进行 初始 化 。 


6.1 结构 的 基本 知识 


我 们 首先 来 建立 一 些 适 用 于 图 形 领域 的 结构 。 点 十 最 基本 的 对 象 ， 假 
定 用 x 与 y 坐标 表示 它 ， 且 x、y 的 坐标 值 都 为 整数 (参见 图 61) 


(0,0) 


图 6.1 
我 们 可 以 采用 结构 存放 这 两 个 坐标 ， 其 声明 如 下 : 


struct point { int x; 

int y; 

}; 

REF struct 引入 结构 声明 。 结 构 声 明 由 包含 在 花 括 号 内 的 一 系列 声 
BAZAR ° REF struct 后 面 的 名 字 是 可 选 的 ， 称 为 结构 标记 (这 里 是 
point)。 结 构 标 记 用 于 为 结构 命名 ， 在 定义 之 后 ， 结 构 标 记 束 代表 人 花 
括号 内 的 声明 ， 可 以 用 它 作为 该 声明 的 简写 形式 。 


结构 中 定义 的 变量 称 为 成 员 。 结 构成 员 、 结 构 标 记 和 普通 变量 ( 即 非 成 
员 ) 可 以 采用 相 


同 的 名 字 ， 它 们 之 间 不 会 冲突 ， 因 为 通过 上 下 文 分 析 总 可 以 对 它们 进 
行 区 分 。 男 外 ， 不 同 结 构 中 的 成 员 可 以 使 用 相同 的 名 字 ， 但 是 ， 从 编 
程 风格 方面 来 说 ， 通 常 只 有 密切 相关 的 对 象 才 会 使 用 相同 的 名 字 。 


struct 声明 定义 了 一 种 数据 类 型 。 在 标志 结构 成 员 表 结束 的 右 花 括 号 之 
后 可 以 跟 一 个 变 量 表 ， 这 与 其 它 基本 类 型 的 变量 声明 是 相同 的 。 例 如 : 


struct { ... } X, Y, Z; 
从 语法 角度 来 说 ， 这 种 方式 的 声明 与 声明 
int X, y, Z; 


具有 类 似 的 意义 。 这 两 个 声明 都 将 x、y 与 z 声明 为 指定 类 型 的 变量 ， 
并 且 为 它们 分 配 存 储 空 间 。 


如 果 结 构 声 明 的 后 面 不 市 变量 表 ， 则 不 需要 为 它 分 配 存 储 空间 ， 它 仪 
仅 描述 了 一 个 结构 的 模板 或 轮 慷 。 但 是 ， 如 果 结 构 声 明 中 带 有 标记 ， 
那么 在 以 后 定义 结构 实例 时 便 可 以 使 用 该 标记 定义 。 例 如 ， 对 于 上 面 
给 出 的 结构 声明 point， 语 句 


struct point pt; 


定义 了 一 个 struct point 类 型 的 变量 pt ° 结构 的 初始 化 可 以 在 定义 的 后 
面 使 用 初 值 表 进行 。 初 值 表 中 同 每 个 成 员 对 应 的 初 值 必须 是 常量 表达 
式 ， 例 如 : 

struct point maxpt = {320, 200}; 

目 动 结构 也 可 以 通过 赋值 初始 化 ， 还 可 以 通过 调用 返回 相应 类 型 结构 
的 函数 进行 初始 化 。 在 表达 式 中 ， 可 以 通过 下 列 形式 引用 某 个 特定 结 
构 中 的 成 员 : 

结构 名 .成 员 


其 中 的 结构 成 员 运 算 符 “." 将 结构 名 与 成 员 名 连接 起 来 。 例 如 ， 可 用 下 
列 语句 打印 点 pt 的 坐标 : 


printf("%d,%d", pt.x, pt.y); 

或 者 通过 下 列 代码 计算 原点 (0, 0) 到 点 pt 的 距离 : 
double dist, sqrt(double); 

dist = sqrt((double)pt.x * pt.x + (double)pt.y * pt.y); 


ZR) BT LURE o FEAT AT LAAT Ze ES ORE HE (BLA 
6.2)， 相 应 的 结构 定 义 如 下 : 


y 


1 pt2 


struct rect { 

struct point pt1; struct point pt2; 

}; 

结构 rect 包含 两 个 point 类 型 的 成 员 。 如 果 按 照 下 列 方式 声明 screen 


变量 : 

struct rect screen; 
则 可 以 用 语句 
screen.pt1.x 


引用 screen 的 成 员 pt1 的 x 坐标 。 


6.2 结构 与 函数 


结构 的 合法 操作 只 有 几 种 :作为 一 个 整体 复制 和 赋值 ， 通 过 & 运 算 符 取 

地 址 ， 访 问 其 成 员 。 AF, AS rel AE TE KEUR BS AKL AAK 

数 返 回 值 。 结 构 之 间 不 可 以 进行 比较 。 可 以 用 一 个 常量 成 员 值 列表 和 初 
台 化 结构 ， 目 动 结构 也 可 以 通过 赋值 进行 初始 化 。 


为 了 更 进一步 地 理解 结构 ， 我 们 编写 儿 个 对 点 和 和 矩形 进行 操作 的 函 
数 。 至 少 可 以 通过 3 种 可 能 的 方法 传递 结构 :一 是 分 别传 递 各 个 结构 成 
w 递 整 个 结构 ， 三 是 传递 指 同 结 构 的 指针 这 3 种 方法 各 有 


首先 来 看 一 下 函数 makepoint， 它 沉 有 两 个 整 型 参数 ， 并 返回 一 
point 类 型 的 结构 : 


/* makepoint: make a point from x and y components */ struct point 
makepoint(int x, int y) 


{ 


struct point temp; 


temp.x = x; temp.y = y; return temp; 

} 

注意 ， 参 数 名 和 结构 成 员 同 名 不 会 引起 冲突 。 事 实 上 ， 使 用 重 名 可 以 
强调 两 者 之 间 的 关系 。 现在 可 以 使 用 makepoint 函数 动态 地 初始 化 任 
意 结 构 ， 也 可 以 向 函数 提供 结构 类 型 的 参 


数 。 例 如 : 


struct rect screen; struct point middle; 

struct point makepoint(int, int); 

screen.pt1 = makepoint(0,0); Screen.pt2 = makepoint(XMAX, YMAX); 
middle = makepoint((screen.pt1.x + screen.pt2.x)/2, 


(screen.ptl.y + screen.pt2.y)/2); 
接 下 来 需要 编写 一 系列 的 函数 对 点 执行 算术 运算 。 例 如 ; 


/* addpoints: add two points */ 
struct addpoint(struct point p1, struct point p2) 


{ 


pl.x += p2.x; pl.y += p2.y; return p1; 

} 

EP, KAARI ER ERRE o ARADR 
HRES pl, MRA 使 用 显 式 的 临时 变量 存储 ， 十 为 了 强调 结构 类 
型 的 参数 和 其 它 类 型 的 参数 一 样 ， 都 是 通过 值 传递 的 。 

下 面 来 看 另外 一 个 例子 。 函 数 prinrect 判断 一 个 点 是 否 在 给 定 的 矩形 
内 部 。 我 们 采用 这 样 一 个 约定 :矩形 包括 其 左 侧 边 和 乓 边 ， 但 不 包括 顶 
边 和 石 侧 边 。 


/* ptinrect: return 1 if p in r, 0 if not */ int ptinrect(struct point p, 
struct rect r) 


{ 

return p.x >= r.ptl.x && p.x < r.pt2.x 
&& p.y >= r.pt1.y && p.y < r.pt2.y; 
} 


这 里 假设 矩形 是 用 标准 形式 表示 的 ， 其 中 ptl 的 坐标 小 于 pt2 的 坐 
标 。 下 列 函 数 将 返回 一 个 规范 形式 的 矩形 : 


#define min(a, b) ((a) < (b) ? (a) : (b)) 
#define max(a, b) ((a) > (b) ? (a) : (b)) 


/* canonrect: canonicalize coordinates of rectangle */ struct rect 
canonrect(struct rect r) 


{ 
struct rect temp; 


temp.pt1.x = min(r.pt1.x, r.pt2.x); 


temp.ptl.y = min(r.pt1.y, r.pt2.y); 

temp.pt2.x = max(r.pt1.x, r.pt2.x); 

temp.pt2.y = max(r.ptl.y, r.pt2.y); return temp; 
} 


如 果 传 递 给 函数 的 结构 很 大 ， 使 用 指针 方式 的 效率 通常 比 复制 整个 结 
构 的 效率 要 高 。 结 构 指 针 类 似 于 普通 变量 指针 。 声 明 


struct point *pp; 

将 pp 定义 为 一 个 指 同 struct point 类 型 对 象 的 指针 。 如 果 pp 指向 一 个 
point 结构 ， 那 A*pp 即 为 该 结构 ， 而 (*pp).x 和 (*pp).y 则 是 结构 成 

员 。 可 以 按照 下 例 中 的 方式 使 用 pp: 

struct point origin, *pp; 

pp = &origin; 

printf("origin is (%d,%d)\n", (*pp).x, (*pp).y); 

其 中 ，(*pp).x 中 的 圆 括号 是 必需 的 ， 因 为 结构 成 员 运 算 符 ” ." 的 优先 
级 比 “*" 的 优先 级 高 。 表 达 式 *pp.x 的 含义 等 价 于 *(pp.x)， 因 为 x 不 
是 指针 ， 所 以 该 表达 式 是 非法 的 。 


结构 指针 的 使 用 频 度 非常 高 ， 为 了 使 用 方便 ，C 语言 提供 了 男 一 种 简 
BAT ° (BE pe 一 个 指向 结 构 的 指针 ， 可 以 用 


p> 结构 成 员 


这 种 形式 引用 相应 的 结构 成 员 。 这 样 ， 就 可 以 用 下 面 的 形式 改写 上 面 
的 一 行 代码 


printf("origin is (%d,%d)\n", pp*>x, pp*>y); 运算 符 . 和 。> 都 是 从 左 至 右 结 
合 的 ， 所 以 ， 对 于 下 面 的 声明 : struct rect r, *rp = 8a; 


以 下 4 个 表达 式 是 等 价 的 : 

r.pt1.x Tp。>pt1.X (r.pt1).x (rp°>pt1).x 

在 所 有 运算 符 中 ， 下 面 4 个 运算 符 的 优先 级 了 最 高 :结构 运算 符 “ ." 和 ” 
>"、 用 于 函数 调用 的 “(0" 以 及 用 于 下 标的 “ []"， 因 此 ， 它 们 同 操 作 数 
之 间 的 结合 也 最 紧密 。 例 如 ， 对 于 结构 声明 

struct { 

int len; char *str; 

} *p; 

表达 式 

++pe>len 

将 增加 len 的 值 ， 而 不 是 增加 p 的 值 ， 这 是 田 为 ， 其 中 的 隐 售 括号 天 
系 是 ++(p*>len)。 可 以 使 用 括号 改变 结合 次 序 。 例 如 :(++p)*>len 将 先 
执行 p 的 加 1 操作 ， 再 对 len 执行 操作 ; 而 (p++)*>len 则 先 对 len 执行 
操作 ， 然 后 再 将 p 加 1( 该 表达 式 中 的 括号 可 以 省 略 ) 。 

同样 的 道理 ，*p。e>str 读 取 的 是 指针 str 所 指向 的 对 象 的 值 ;*p。>strt++ 完 
读 取 指 针 str 指 同 的 对 象 的 值 ， 然 后 再 将 str 加 1( 与 *s++ 相 同 ); 


(*p*>str)++ 将 指针 str 指向 的 对 象 的 值 加 1;*p++。>str 完 读 取 指针 str FE 
癌 的 对 象 的 值 ， 然 后 再 将 p 加 1。 


6.3 结构 数组 


考虑 编写 这 样 一 个 程序 ， 它 用 来 统计 输入 中 各 个 C 语言 关键 字 出 现 的 
次 数 。 我 们 需要 用 一 个 字符 捉 数 组 存放 天 键 字 名 ， 一 个 整 型 数组 存放 
相应 关键 字 的 出 现 次 数 。 一 种 实现 方法 是 ， 使 用 两 个 独立 的 数组 
keyword 和 keycount 分 别 存 放 它 们 ， 如 下 所 示 


char *keyword[NKEYS]; int keycountLNKEYS]; 


我 们 注意 到 ， 这 两 个 数组 的 大 小 相同 ， 考 虑 到 该 特点 ， 可 以 采用 另 一 
a u 也 就 是 我 们 这 里 所 说 的 结构 数组 。 每 个 关键 字 页 
包括 一 对 变量 : 


char *word; int cout; 


这 样 的 多 个 变量 对 共同 构成 一 个 数组 。 我 们 来 看 下 面 的 声明 : 


struct key { char *word; int count; 


} keytab[NKEYS]; 
它 声明 了 一 个 结构 类 型 key， 并 定义 了 该 类 型 的 结构 数组 keytab, [F] 


时 为 其 分 配 存储 空间 。 数组 keytab 的 每 个 元 素 都 是 一 个 结构 。 上 述 声 
明 也 可 以 写成 下 列 形 式 : 


struct key { char *word; int count; 
I 
struct key keytab NKEYS]; 


因为 结构 keytab 包含 一 个 固定 的 名 字 集 合 ， 所 以 ， 最 好 将 它 声 明 为 外 
部 变量 ， 这 样 ， 只 需要 初始 化 一 次 ， 所 有 的 地 方 都 可 以 使 用 。 这 种 结 
构 的 初始 化 方法 同 前 面 所 述 的 初始 化 方 法 类 似 一 一 在 定义 的 后 面 通过 
一 个 用 圆 括号 括 起 来 的 初 值 表 进 行 初 始 化 ， 如 下 所 示 : 


struct key { char *word; int count; 
} keytab[] = { 

"auto", 0, 

"break", 0， 

"case", 0, 

"char", 0, 

"const", 0, 

"continue", 0, 

"default", 0, 

JE | 


"unsigned", 0, 


"void", 0, 
"volatile", 0, 
"while", 0 

}; 


与 结构 成 员 相对 应 ， 初 值 也 要 按照 成 对 的 方式 列 出 。 更 精确 的 做 法 
征 ， 将 每 一 行 ( 即 每 个 结 构 ) 的 初 值 都 括 在 伦 括 号 内 ， 如 下 所 示 : 


{ "auto", 0 }, 
{ "break", 0 }, 


{ "case", 0 }, 


但 是 ， 如 采 初 值 是 简单 变量 或 字符 串 ， 并 且 其 中 的 任何 值 都 不 为 空 ， 
则 内 层 的 花 括 号 可 以 省 上 略 。 通 常情 况 下 ， 如 果 初 值 存在 并 且 方 括号 [] 
中 没有 数值 ， 编 译 程序 将 计算 数组 keytab 中 的 页 数 。 

在 统计 关键 字 出 现 次数 的 程序 中 ， 我 们 首先 定义 了 keytab。 主 程序 反 
复 调 用 函数 getword 读 取 和 输入， 每 次 读 取 一 个 单词 。 每 个 单词 将 通过 
折 半 查找 函数 (参见 第 3 章 ) 在 keytab 中 进行 查找 。 注 意 ， 关 键 字 列表 
必须 按 升 序 存储 在 keytab 中 。 

#include <stdio.h> 

#include <ctype.h> 

#include <string.h> 


#define MAXWORD 100 


int getword(char *, int); 


int binsearch(char *, struct key *, int); 

/* count C keywords */ main() 

{ 

int n; 

char word[MAX WORD]; 

while (getword(word, MAXWORD) != EOF) if (isalpha(word[0])) 
if ((n = binsearch(word, keytab, NKEYS)) >= 0) keytab[n].count++; 
for (n = 0; n < NKEYS; n++) if (keytab[n].count > 0) 

printf("%4d %s\n", 

keytab[n].count, keytab[n].word); 

return 0; 

} 


/* binsearch: find word in tab[0]...tab[ne1] */ int binsearch(char 
*word, struct key tab[], int n) 


{ 

int cond; 

int low, high, mid; 
low = 0; 

high =n 1; 


while (low <= high) { mid = (lowthigh) / 2; 


if ((cond = stremp(word, tab[mid].word)) < 0) high = mid ° 1; 

else if (cond > 0) low = mid + 1; 

else 

return mid; 

} 

return °1; 

} 

函数 getword 将 在 稍 后 介绍 ， 这 里 只 需要 了 解 它 的 功能 是 每 调用 一 次 
该 函数 ， 将 读 入 一 个 单词 ， 并 将 其 复制 到 名 字 为 该 画 数 的 第 一 个 参数 
的 数组 中 。 

NKEYS 代表 keytab 中 关键 字 的 个 数 。 尽 管 可 以 手工 计算 ， 但 由 机 比 
实现 会 更 简单 、 更 安全 ， 当 列表 可 能 变更 时 尤其 如 此 。 一 种 解决 办 法 
是 ， 在 初 值 表 的 结尾 处 加 上 一 个 空 指针 ， 然后 循环 遇 历 keytab, EFI 
读 到 尾部 的 空 指针 为 止 。 


但 实际 上 并 不 需要 这 样 做 ， 因 为 数组 的 长 度 在 编译 时 已 经 完全 确定 ， 
它 等 于 数组 页 的 长 度 乘 以 页 数 ， 因 此 ， 可 以 得 出 页 数 为 : 


Keytab 的 长 度 /struct key 的 长 度 


C 语言 提供 了 一 个 编译 时 (compile*time) 一 元 运算 符 sizeof， 它 可 用 
来 计算 任 一 对 象 的 长 度 。 表 达 式 


sizeof 对 象 
以 及 


sizeof( 类 型 名 ) 


将 返回 一 个 整 型 值 ， 它 等 于 指定 对 象 或 类 型 占用 的 存储 空间 字 节 数 。 
(严格 地 说 ，sizeof 的 返回 值 是 无 符号 整 型 值 ， 其 类 型 为 size t， 该 类 
讲 在 头 文件 <stddefh> 中 定义 。) 其 中 ， 对 象 可 以 是 变量 、 数 组 或 结构 ; 
类 型 可 以 是 基本 类 型 ， 如 int 、double， 也 可 以 是 派生 类 型 ， 如 结构 类 
型 或 指针 类 型 。 


在 该 例子 中 ， 关 键 字 的 个 数 等 于 数组 的 长 度 除 以 单个 元 素 的 长 度 。 下 
面 的 #define 语句 使 用 了 这 种 方法 设置 NKEYS 的 值 : 


#define NKEYS (sizeof keytab / sizeof(struct key)) 

男 一 种 方法 是 用 数组 的 长 度 除 以 一 个 指定 元 素 的 长 度 ， 如 下 所 示 : 
#define NKEYS (sizeof keytab / sizeof(keytab[0])) 

使 用 第 二 种 方法 ， 即 使 类 型 改变 了 ， 也 不 需要 改动 程序 。 


条 件 编译 语句 ##f 中 不 能 使 用 sizeof， 因 为 预 处 理 器 不 对 类 型 名 进行 分 
析 。 但 预 处 理 器 并 不 计算 #define 语句 中 的 表达 式 ， 因 此 ， 在 #define 
中 使 用 sizeof 是 合法 的 。 


下 面 来 讨论 函数 getword。 我 们 这 里 给 出 一 个 更 通用 的 getword 函数 。 

该 函数 的 功能 已 超出 这 个 示例 程序 的 要 求 ， 不 过 ， 画 数 本 喘 并 不 复 

杂 “。getword 从 输入 中 读 取 下 一 个 单词 ， 单词 可 以 是 以 字母 开头 的 字 

母 和 数字 串 ， 也 可 以 是 一 个 非 空 日 符 字 符 。 函 数 返 回 值 可 能 是 单 词 的 

` 文件 结束 符 EOF 或 字符 本 号 ( 如 果 该 字符 不 是 字母 字符 
JHE) ° 


/* getword: get next word or character from input */ int 
getword(char *word, int lim) 


{ 
int c, getch(void); void ungetch(int); char *w = word; 


while (isspace(c = getch())) 


if (c != EOF) 

*wtt = Ç; 

if (!isalpha(c)) { 

*w = '\0'; return C; 

} 

for (; eelim > 0; w++) 

if (tisalnum(*w = getch())) { ungetch(*w); 
break; 

} 


*w = '\0'; return word[0]; 


} 


getword 函数 使 用 了 第 4 草 中 的 函数 getch 和 ungetch。 当 读 入 的 字符 
不 属于 字母 数 字 的 集合 时 ， 说 明 getword 多 读 入 了 一 个 字符 。 随 后 ， 
调用 ungetch 将 多 读 的 一 个 字符 放 回 到 和 输入 中 ， 以 便 下 一 次 调用 使 

用 。Getword 还 使 用 了 其 它 一 些 函 数 :isspace HABA 白 符 ，isalpha 
函数 识别 字母 ，isalnum 函 数 识别 字母 和 数字 。 所 有 这 些 函 数 都 定义 在 
标准 头 文 件 <ctype.h> 中 。 


练习 6"1 Eyt getword 函数 不 能 正确 处 理 下 划 线 、 字 符 串 党 
量 、 注 释 及 预 处 理 絮 控 制 指 令 。 请 编写 一 个 更 完善 的 getword 函数 。 


6.4 指向 结构 的 指针 


为 了 进一步 说 明 指 向 结构 的 指针 和 结构 数组 ， 我 们 重新 编写 关键 字 统 
计 程 序 ， 这 次 采用 指针 ， 而 不 使 用 数组 下 标 。 


keytab 的 外 部 声明 不 需要 修改 ， 但 main 和 binsearch 函数 必须 修改 。 
修改 后 的 程序 如 下 : 


#include <stdio.h> 


#include <ctype.h> 

#include <string.h> 

#define MAXWORD 100 

int getword(char *, int); 

struct key *binsearch(char *, struct key *, int); 

/* count C keywords; pointer version */ main() 

{ 

char word[MAXWORD)]; struct key *p; 

while (getword(word, MAXWORD) != EOF) if (isalpha(word[0])) 
if ((p=binsearch(word, keytab, NKEYS)) != NULL) p*>count++; 
for (p = keytab; p < keytab + NKEYS; p++) if (p*>count > 0) 
printf("%4d %s\n", ps>count, ps>word); return 0; 


} 


/* binsearch: find word in tab[0]...tab[ne1] */ 

struct key *binsearch(char *word, struck key *tab, int n) 
{ 

int cond; 

struct key *low = &tab[0]; struct key *high = &tab[n]; struct key *mid; 
while (low < high) { 

mid = low + (highelow) / 2; 

if ((cond = strcmp(word, mid*>word)) < 0) high = mid; 
else if (cond > 0) low = mid + 1; 

else 

return mid; 

} 

return NULL; 


} 


这 里 需要 注意 几 点 。 首 先 ，binsearch 函数 在 声明 中 必须 表明 : 它 返 回 的 
值 类 型 是 一 个 Fg struct key 类 型 的 指针 ， 而 非 整 型 ， 这 在 函数 原型 
及 binsearch 函数 中 都 要 声明 。 如果 binsearch 找到 与 输入 单词 匹配 的 
数组 元 素 ， 它 将 返回 一 个 指 问 该 元 素 的 指针 ， 否 则 返 回 NULL 。 


其 次 ，keytab 的 元 素 在 这 里 是 通过 指针 访问 的 。 这 就 需要 对 binsearch 
做 较 大 的 修改 。 在 这 里 ，low 和 high 的 初 值 分 别 古 指向 表 头 元 素 的 指 
针 和 指向 表 尾 元 素 后 面 的 一 个 元 于 


的 指针 。 
这 样 ， 我 们 天 无 法 简单 地 通过 下 列表 达 式 计算 中 间 元 素 的 位 置 : 
mid = (lowthigh) / 2 /* WRONG */ 


这 是 因为 ， 两 个 指针 之 间 的 加 法 运 泪 是 非法 的 。 但 是 ， 指 针 的 减法 运 
算 却 是 合法 的 ，high*low 的 值 束 是 数组 元 素 的 个 数 ， 因 此 ， 可 以 用 下 
列表 达 式 : 

mid = low + (highelow) / 2 

将 mid 设置 为 指 同 位 于 high 和 low 之 间 的 中 间 元 素 的 指针 。 对 算法 
的 最 重要 修改 在 于 ， 要 确保 不 会 生成 非法 的 指针 ， 或 者 是 试图 访问 数 
组 范围 之 外 


的 元 素 。 问 题 在 于 ，&tab[*1] 和 &tab[n] 都 超出 了 数组 tab 的 范围 。 前 者 
征 绝对 非法 的 ， 


而 对 后 者 的 间接 引用 也 是 非法 的 。 但 是 ，C 语言 的 定义 保证 数组 末尾 
之 后 的 第 一 个 元 素 ( 即 


&tab[n]) 的 指针 算术 运算 可 以 正确 执行 。 
主 程序 main 中 有 下 列 语句 : 


for (p = keytab; p < keytab + NKEYS; p++) 


WAR p 是 指 癌 结构 的 指针 ， 则 对 p 的 算术 运算 需要 考虑 结构 的 长 度 ， 
所 以 ， 表 达 式 p++ 执 行 时 ， 将 在 p 的 基础 上 加 上 一 个 正确 的 值 ， 以 确 
a A E E, 


但 是 ， 千 万 不 要 认为 结构 的 长 度 等 于 各 成 员 长 度 的 和 。 因 为 不 同 的 对 
象 有 不 同 的 对 齐 要 求 ， 所 以 ， 结 构 中 可 能 会 出 现 未 命名 的 " 空 穴 " 
(hole)。 例 如 ， 假 设 char 类 型 占用 一 个 字 方 ，int 类 型 占用 4 个 字 
节 ， 则 下 列 结构 : 


struct { 

char c; int i; 

}; 

可 能 需要 8 个 字 节 的 存储 空间 ， 而 不 是 5 个 字 节 。 使 用 sizeof 运算 符 
可 以 返回 正确 的 对 象 长 度 。 


最 后 ， 说 明 一 点 程序 的 格式 问题 : 当 函 数 的 返回 值 类 型 比较 复杂 时 (如 
结构 指针 )， 例 如 


struct key *binsearch(char *word, struct key *tab, int n) 


REE BS, CARRA TEA SCAR a ECE BS o HEAT AY DL 
RAF RBS E 述 语句 : 


struct key * 


binsearch(char *word, struct key *tab, int n) 


具体 采用 哪 种 写法 属于 个 人 的 习惯 问题 ， 可 以 选择 目 己 言 欢 的 方式 并 
始终 保持 目 己 的 风格 。 


6.5 自 引 用 结构 


假定 我 们 需要 处 理 一 个 更 一 般 化 的 问题 :统计 输入 中 所 有 单词 的 出 现 次 
数 。 因 为 预先 不 知道 出 现 的 单词 列表 ， 所 以 无 法 方便 地 排序 ， 并 使 用 
折 半 查找 ;也 不 能 分 别 对 输入 中 的 每 个 单词 都 执行 一 次 线性 查找 ， 看 它 
在 前 面 是 否 已 经 出 现 ， 这 样 做 ， 程 序 的 执行 将 花费 太 长 的 时 间 。( 更 
准确 地 说 ， 程 序 的 执行 时 间 是 与 输入 单词 数目 的 二 次 方 成 比例 的 。) 我 
们 该 如 何 组 织 这 些 数 据 ， 才 能 够 有 效 地 处 理 一 系列 任意 的 单词 昵 ? 


一 种 解决 方法 是 ， 在 读 取 输 入 中 任意 单词 的 同时 ， 就 将 它 放 置 到 正确 
的 位 置 ， 从 而 始终 保证 所 有 单词 是 按 顺序 排列 的 。 昌 然 这 可 以 不 用 通 
BED 然 会 导致 程序 执行 的 时 间 过 
"我们 可 以 使 用 一 种 称 为 二 叉 树 的 数据 结构 来 取而代之 。 

每 个 不 同 的 单词 在 树 中 都 是 一 个 让 点， 每 个 节点 包含 : 

一 个 指向 该 单词 内 容 的 指针 

一 个 统计 出 现 次 数 的 计数 值 

一 个 指向 左 子 树 的 指针 

一 个 指向 右 子 树 的 指针 
任何 市 点 最 多 拥有 两 个 子 树 ， 也 可 能 只 有 一 个 子 树 或 一 个 都 没有 。 对 
节点 的 所 有 操作 要 保证 ， 任 何 市 点 的 左 子 树 只 包 售 按 字典 序 小 于 该 广 
点 中 单词 的 那些 


单词 ， 右 子 树 只 包含 按 字典 序 大 于 该 节点 中 单词 的 那些 单词 。 图 6.3 
是 按 序 插入 句子 “now is the 


time for all good men to come to the aid of their party" 中 各 单词 后 生成 的 
树 。 


all good party their to 


aid come 
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要 得 找 一 个 新 单词 是 否 已 经 在 树 中 ， 可 以 从 根 节 点 开始 ， 比 较 痢 单词 
与 该 节点 中 的 单词 。 大 匹配 ， 则 得 到 肯定 的 答案 。 寿 新 单词 小 于 该 他 
点 中 的 单词 ， 则 在 左 子 树 中 继续 查找 ， 否 则 在 右 子 树 中 碍 找 。 如 在 搜 
SAME, WGA a Se, HH, SHS ieee 
FF BGS A EWW ERME ° I AE RT HH AC A) EA HT] 
样 的 方式 查找 它 的 一 个 子 树 ， 所 以 该 过 程 是 递归 的 。 相 应 地 ， 在 插入 
和 打印 操作 中 使 用 递归 过 程 也 是 很 目 然 的 事情 。 


我 们 再 来 看 节点 的 描述 问题 。 骤 方便 的 表示 方法 是 表示 为 包括 4 个 成 
员 的 结构 : 


struct tnode { /* the tree node: */ 


char *word; /* points to the text */ 


int count; /* number of occurrences */ 


struct tnode *left; /* left child */ struct tnode *right; /* right 
child */ 


fa 


这 种 对 节点 的 递归 的 声明 方式 看 上 去 好 像 是 不 确定 的 ， 但 它 的 确 是 正 
,一 个 包含 其 自身 实例 的 结构 是 非法 的 ， 但 是 ， 下 列 声明 是 合法 


struct tnode *left; 


它 将 left 声明 为 指向 tnode 的 指针 ， 而 不 是 mode 实例 本 号 。 我 们 偶尔 
自 引 用 结构 的 一 种 变 体 :两 个 结构 相互 引用 。 有 具体 的 使 用 方法 
HD: 


struct t { 


struct s *p; /* p points to an s */ 
}; 


struct s { 


struct t *q; /* q points to at */ 

p 

如 下 所 示 ， 整 个 程序 的 代码 非常 短小 。 当 然 ， 它 需要 我 们 前 面 编 写 的 
一 些 程序 的 文 持 ， 比如 getword 等 。 主 函数 通过 getword 读 入 单词 ， 
并 通过 addtree 函数 将 它们 插入 到 树 中 。 

#include <stdio.h> 


#include <ctype.h> 


#include <string.h> 

#define MAXWORD 100 

struct tnode *addtree(struct tnode *, char *); void treeprint(struct tnode *); 
int getword(char *, int); 

/* word frequency count */ main() 

{ 

struct tnode *root; char word[MAXWORD)]; 

root = NULL; 

while (getword(word, MAXWORD) != EOF) if (isalpha(word[0])) 

root = addtree(root, word); treeprint(root); 

return 0; 

} 

函数 addtree 是 递归 的 。 主 画 数 main SSM ATTA RU) — 
个 单词 将 作为 树 的 最 顶层 ( 即 树 的 根 )。 在 每 一 步 中 ， 新 单词 与 让 点 中 
存储 的 单词 进行 比较 ， 随 后 ， 通 过 递归 调用 addtree 而 转向 左 子 树 或 
右 子 树 。 该 单词 最 终 将 与 树 中 的 某 王 点 匹配 (这 种 情况 下 计数 值 加 
1), BIE Bl — 28 Fa ET (BRA i Be — A AA BY 中 )。 若 生成 
了 新 节点 ， 则 addtree 返回 一 个 指 辣 新 廊 点 的 指针 ， 该 指针 保存 在 父 市 
A o 


struct tnode *talloc(void); char *strdup(char *); 


/* addtree: add a node with w, at or below p */ struct treenode 
*addtree(struct tnode *p, char *w) 


{ 
int cond; 
if (p == NULL) { /* anew word has arrived */ p = talloc(); 


/* make a new node */ p*>word = strdup(w); 
p*>count = 1; 
pe>left = p*>right = NULL; 


} else if ((cond = stremp(w, p*>word)) == 0) ps>count++; i 
repeated word */ 


else if (cond < 0) /* less than into left subtree */ pe>left = 
addtree(p*>left, w); 


else /* greater than into right subtree */ pe>right = addtree(p*>right, 
w); 


return p; 
} 


新 方 点 的 存储 空间 由 子 程序 talloc 获得 。talloc 函数 返回 一 个 指针 ， 指 
回 能 容纳 一 个 树 证 点 的 空 闪 空间 。 函 数 strdup 将 新 单词 复制 到 某 个 隐 
藏 位 置 ( 稍 后 将 讨论 这 些 子 程序 )。 计 数值 将 被 初始 化 ， 两 个 子 树 被 置 
为 空 (NULL)。 增 加 新 市 点 时 ， 这 部 分 代码 只 在 树叶 部 分 执行 。 该 程 
序 忽略 了 对 strdup 和 talloc 返回 值 的 出 错 检查 (这 显然 是 不 完善 的 ) 。 


treeprint 函数 按 顺 序 打印 树 。 在 每 个 节点 ， 它 先 打 印 左 子 树 (小 于 该 单 
词 的 所 有 单词 )， 然后 是 该 单词 本 身 ， 最 后 是 右 子 树 (大 于 该 单词 的 所 
有 单词 )。 如果 你 对 囊 归 控 作 有 些 疑 惑 的 话 ， 不 妨 在 上 面 的 树 中 模拟 
treeprint 的 执行 过 程 。 


/* treeprint: ineorder print of tree p */ void treeprint(struct tnode *p) 
{ 

if (p != NULL) { 

treeprint(p*>left); 

printf("%4d %s\n", p*>count, p*>word); treeprint(p*>right); 

} 

} 


这 里 有 一 点 值得 注意 :如 采 单 词 不 是 按照 随机 的 顺序 到 达 的 ， 树 将 变 得 
不 平衡 ， 这 种 情况 下 ， 程 序 的 运行 时 间 将 大 大 增加 。 最 坏 的 情况 下 ， 
知 单 词 已 经 排 好 序 ， 则 程序 模拟 线性 得 找 的 开销 将 非常 大 。 某 些 广义 
二 叉 树 不 受 这 种 最 坏 情况 的 影响 ， 在 此 我 们 不 讨论 。 


在 结束 该 例子 之 前 ， 我 们 简单 讨论 一 下 有 关 存 储 分 配 程序 的 问题 。 尽 
管 存储 分 配 程序 需 要 为 不 同 的 对 象 分 配 存储 空间 ， 但 显然 ， 程 序 中 只 
会 有 一 个 存储 分 配 程序 。 但 是 ， 假 定 用 一 个 分 配 程序 来 处 理 多 种 类 型 
的 请 求 ， 比 如 指向 char 类 型 的 指针 和 指 疝 struct tnode 类 型 的 指针 ， 
则 会 出 现 两 个 问题 。 第 一 ， 它 如 何在 大 多 数 实际 机 器 上 满足 各 种 类 型 
对 象 的 对 齐 要 求 ( 例 如 ， 整 型 通常 必须 分 配 在 偶数 地 址 上 )， 第 二 ， 使 
用 什么 样 的 声明 能 处 理 分 配 程序 必须 能 返回 不 同类 型 的 指针 的 问题 ? 


对 齐 要 求 一 般 比 较 容 易 满 足 ， 只 需要 确保 分 配 程序 始终 返回 满足 所 有 

对 齐 限制 要 求 的 指 针 就 可 以 了 ， 其 代价 是 牺牲 一 些 存 储 空间 。 第 5 章 

介绍 的 alloc 函数 不 保证 任何 特定 类 型 的 对 齐 ， 所 以 ， 我 们 使 用 标准 

> ae 它 能 够 满足 对 齐 要求 。 第 8 章 将 介绍 实现 malloc 函数 
一 种 方法 。 


对 于 任何 执行 严格 类 型 检查 的 语言 来 说 ， 像 malloc 这 样 的 函数 的 类 型 
声明 总 是 很 令 人 头疼 的 问题 。 在 C 语言 中 ， 一 种 合适 的 方法 是 将 
malloc 的 返回 值 声明 为 一 个 指向 void 类 型 的 指针 ， 然 后 再 显 式 地 将 该 
指针 强制 转换 为 所 需 类 型 。malloc 及 相关 函数 声明 在 标准 头 文 件 
<stdlib.h> 中 。 因 此 ， 可 以 把 talloc 函数 写成 下 列 形式 : 


#include <stdlib.h> 
/* talloc: make a tnode */ struct tnode *talloc(void) 
{ 


return (struct tnode *) malloc(sizeof(struct tnode)); 
} 


aun ee arr FFF RS BET EEN IME ° 
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malloc 函数 实现 的 : 


char *strdup(char *s) /* make a duplicate of s */ 

{ 

char *p; 

p = (char *) malloc(strlen(s)+1); /* +1 for '\0' */ if (p != NULL) 
strcpy(p, s); return p; 

} 


在 没有 可 用 空间 时 ，malloc 函数 返回 NULL， 同 时 ，strdup 函数 也 将 
返回 NULL，strdup 


玉 数 的 调用 者 负 贡 出 错 处 理 。 


调用 malloc 函数 得 到 的 存储 空间 可 以 通过 调用 free 函数 释放 以 重用 。 
详细 信息 请 参 见 第 7 章 和 第 8 章 。 

练习 692 编写 一 个 程序 ， 用 以 读 入 一 个 C 语言 程序 ， 并 按 字 母 
表 顺 序 分 组 打印 变量 名 ， 要 求 每 一 组 内 各 变量 名 的 前 6 个 字符 相同 ， 
其 余 字 符 不 同 。 字 符 串 和 注释 中 的 单词 不 予 考 虑 。 

请 将 6 作为 一 个 可 在 命令 行 中 设 定 的 参数 。 

练习 693 编写 一 个 交叉 引用 程序 ， 打 印 文档 中 所 有 单词 的 列 
表 ， 并 且 每 个 单词 还 有 一 个 列表 ， 记 杂 出 现 过 该 单词 的 行 号 。 对 
the ` and 等 非 实 义 单词 不 予 考 虑 。 


练习 694 编写 一 个 程序 ， 根 据 单词 的 出 现 频 率 按 降序 打印 输入 
的 各 个 不 同 单词 ， 并 在 每 个 单词 的 前 面 标 上 它 的 出 现 次 数 。 


6.6 KAIR 

为 了 对 结构 的 更 多 方面 进行 深入 的 讨论 ， 我 们 来 编写 一 个 表 查 找 程 序 
包 的 核心 部 分 代码 。 这 段 代码 很 典型 ， 可 以 在 宏 处 理 絮 或 编译 絮 的 从 
号 表 管 理 例 程 中 找到 。 例 如 ， 考 虑 #define 语句 。 当 过 到 类 似 于 
#define IN 1 


之 类 的 程序 行 时 ， 就 需要 把 名 字 IN 和 替换 文本 1 存 入 到 某 个 表 中 。 
此 后 ， 当 名 字 IN 出 现在 某 些 语句 中 时 ， 如 : 


statet = IN; 
WAAL 1 REH IN © 


以 下 两 个 函数 用 来 处 理 名 字 和 奉 换 文本 。install(s, D 函 数 将 名 字 s FUE 
换文 本 t 记录 到 某 个 表 中 ， 其 中 s 和 t 仪 仅 古 字符 串 。lookup(s) 芳 数 在 
表 中 查找 s， 若 找到 ， 则 返 回 指向 该 处 的 指针 ; 邦 没 找到 ， 则 返回 
NULL ° 


该 算法 采用 的 是 散 列 查找 方法 一 将 输入 的 名 字 转 换 为 一 个 小 的 非 负 
整数 ， 该 整数 随后 将 作为 一 个 指针 数组 的 下 标 。 数 组 的 每 个 元 素 指向 
某 个 链表 的 表 头 ， 链 表 中 的 各 个 块 用 于 描 述 具 有 该 散 列 值 的 名 字 。 如 
果 没 有 名 字 散 列 到 该 值 ， 则 数组 元 素 的 值 为 NULL( 参 见 图 64) © 


° » e 
3 e name 
0 Ts ~~a defn 
rm 
0 o+—> name 
一 defn 
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链表 中 的 每 个 块 都 是 一 个 结构 ， 它 包含 一 个 指向 名 字 的 指针 、 一 个 指 
向 替换 文本 的 指针 以 及 一 个 指 癌 该 链表 后 继 块 的 指针 。 如 采 指 向 链表 
后 继 块 的 指针 为 NULL， 则 表明 链表 结束 。 


struct nlist { /* table entry: */ 

struct nlist *next; /* next entry in chain */ char 
*name; /* defined name */ 

char *defn; /* replacement text */ 

F 


相应 的 指针 数组 定义 如 下 : 


#define HASHSIZE 101 
Static struct nlist *hashtab| HASHSIZE]; /* pointer table */ 


散 列 函数 hash 在 lookup 和 install 函数 中 都 被 用 到 ， 它 通过 一 个 for 循 
环 进行 计算 ， 每 次 循环 中 ， 它 将 上 一 次 循环 中 计算 得 到 的 结果 值 经 过 
变换 ( 即 乘 以 31) 后 得 到 的 新 值 同 字 符 串 中 当前 字符 的 值 相 加 (*s + 31 * 
hasta 然后 将 该 结果 值 同 数组 长 度 执 行 取 模 操作 ， 其 结果 即 是 该 
函数 的 返回 值 。 这 并 不 是 最 好 的 散 列 函数 ， 但 比较 简短 有 效 。 


/* hash: form hash value for string s */ unsigned hash(char *s) 

{ 

unsigned hashval; 

for (hashval = 0; *s != '\0'; s++) hashval = *s + 31 * hashval; 

return hashval % HASHSIZE; 

} 

由 于 在 散 列 计算 时 采用 的 是 无 符 吕 算术 运算 ， 因 此 保证 了 散 列 值 非 


人 负 。 散 列 过 程 生成 了 在 数组 hashtab 中 执行 查找 的 起 始 下 标 。 如 果 该 
字符 串 可 以 被 得 找到 ， 


则 它 一 定位 于 该 起 始 下 标 指 向 的 链表 的 某 个 块 中 。 上 有 具 体 查 找 过 程 由 
lookup 函数 实现 。 如 果 


lookup 函数 发 现 表 页 已 存在 ， 则 返回 指向 该 表 页 的 指针 ， 否 则 返回 
NULL ° 


/* lookup: look for s in hashtab */ struct nlist *lookup(char *s) 


{ 


struct nlist *np; 


for (np = hashtab[hash(s)]; np != NULL; np = np*>next) if 
(strcmp(s, np*>name) == 0) 

return np; /* found */ return NULL; /* not found */ 
} 


lookup 函数 中 的 for 循环 是 遍历 一 个 链表 的 标准 方法 ， 如 下 所 示 : 


for (ptr = head; ptr != NULL; ptr = ptre>next) 


install 函数 借助 lookup 函数 判断 等 加 入 的 名 字 是 否 已 经 存在 。 如 采 已 
存在 ， 则 用 新 的 定义 取而代之 ;否则 ， 创 建 一 个 新 表 页 。 如 无 足够 空间 
创建 新 表 页 ， 则 install 函数 返回 NULL ° 


struct nlist *lookup(char *); char *strdup(char *); 


/* install: put (name, defn) in hashtab */ struct nlist *install(char 
*name, char *defn) 


{ 


struct nlist *np; unsigned hashval; 


if (np = lookup(name)) == NULL) { /* not found */ np = (struct nlist *) 
malloc(sizeof(*np)); 


if (np == NULL || (np*>name = strdup(name)) == NULL) return NULL; 
hashval = hash(name); np*>next = hashtab[hashval]; hashtab[hashval] = np; 
} else /* already there */ 


free((void *) np*>defn); /*free previous defn */ if ((np*>defn = 
strdup(defn)) == NULL) 


return NULL; return np; 


} 

练习 65 编写 函数 undef， 它 将 从 由 lookup 和 install 维护 的 表 
中 删除 一 个 变量 及 其 定义 。 

练习 66 以 本 和 介绍 的 函数 为 基础 ， 编 写 一 个 适合 C 语言 程序 


使 用 的 #define 处 理 器 的 简单 版 本 ( 即 无 参数 的 情况 )。 你 会 发 现 getch 
和 ungetch 函数 非常 有 用 。 


6.7 类 型 定义 Ctypedef) 


C 语言 提供 了 一 个 称 为 typedef 的 功能 ， 它 用 来 建立 靳 的 数据 类 型 名 ， 
例如 ， 声 明 


typedef int Length; 


$ Length 定义 为 与 int 具有 同等 意义 的 名 字 。 类 型 Length 可 用 于 类 型 
声明 、 类 型 转换 等 ， 它 和 类 型 int 完全 相同 ， 例 如 : 


Length len, maxlen; Length *lengths[]; 


类 似 地 ， 声 明 


typedef char* String; 


将 String 定义 为 与 char * 或 字符 指针 同 义 ， 此 后 ， 便 可 以 在 类 型 声明 
和 类 型 转换 中 使 用 String， 例 如 : 


String p, lineptr[MAXLINES], alloc(int); int stremp(String, String); 

p = (String) malloc(100); 

注意 ，typedef 中 声明 的 类 型 在 变量 名 的 位 置 出 现 ， 而 不 是 紧 接 在 关键 
typedef 之 后 。typedef 在 语法 上 类 似 于 存储 类 exter ` static 等 。 我 
们 在 这 里 以 大 写字 母 作为 typedef 定义 的 类 型 名 的 首 字母 ， 以 示 区 别 。 


Se typedef 定义 本 章 前 面 介 绍 的 树 世 点。 如 
ZN: 


typedef struct tnode *Treeptr; 


typedef struct tnode { /* the tree node: */ char *word; /* points to 
the text */ 
int count; /* number of occurrences */ struct tnode *left; 
/* left child */ 
struct tnode *right; /* right child */ 


} Treenode; 


上 述 类 型 定义 创建 了 两 个 新 类 型 关键 字 :Treenode( 一 个 结构 ) 和 
Treeptr( 一 个 指 回 该 结构 的 指针 )。 这 样 ， 函 数 talloc 可 相应 地 修改 为 : 


Treeptr talloc(void) 

{ 

return (Treeptr) malloc(sizeof(Treenode)); 
} 


这 里 必须 强调 的 是 ， 从 任何 意义 上 讲 ，typedef 声明 并 没有 创建 一 个 新 
类 型 ， 它 只 是 为 某 个 已 存在 的 类 型 增加 了 一 个 新 的 名 称 而 已 。typedef 
声明 也 没有 增加 任何 新 的 语义 :通过 这 种 方式 声明 的 变量 与 通过 普通 声 
明 方 式 声明 的 变量 具有 完全 相同 的 属性 。 实 际 上 ，typedef RMF 
#define 语句 ， 但 由 于 typedef 是 由 编译 全 解释 的 ， 因 此 它 的 文本 蔡 换 
功能 要 超过 预 处 理 器 的 能 力 。 例 如 : 


typedef int (*PFI)(char *, char *); 
该 语句 定义 了 类 型 PFI EAE KRITE, EBA AP char 


* 类 型 的 参数 ， 返 回 值 类 型 为 nt"， 它 可 用 于 某 些 上 下 文中 ， 例 如 ， 可 
以 用 在 第 5 章 的 排序 程序 中 ， 如 下 所 未 : 


PFI strcmp, numcmp; 


除了 表达 方式 更 简洁 之 外 ， 使 用 typedef 还 有 另外 两 个 重要 原因 。 首 
先 ， 它 可 以 使 程序 参数 化 ， 以 提高 程序 的 可 移植 性 。 如 有 果 typedef 声 
明 的 数据 类 型 同 机 絮 有 关 ， 那 么 ， 当 程序 


移植 到 其 它 机 器 上 时 ， 只 需 改 变 typedef RAVE MELA LAT ° —h2A 
用 到 的 情况 是 ， 对 于 各 种 不 同 大 小 的 整 型 值 来 说 ， 都 使 用 通过 typedef 
定义 的 类 型 名 ， 然 后 ， 分 别 为 各 个 不 同 的 入 主机 选择 一 组 合适 的 

short、int 和 long 类 型 大 小 即 可 。 标 准 库 中 有 一 些 例子 ， 例 如 size_t 和 


ptrdiff_t 等 。 


typedef 的 第 二 个 作用 是 为 程序 提供 更 好 的 说 明 性 
比 一 个 声明 为 指 癌 复杂 结构 的 指针 更 容易 让 人 理解 。 


6.8 联合 


联合 是 可 以 (在 不 同时 刻 ) 保 存 不 同类 型 和 长 度 的 对 象 的 变量 ， 编 译 雁 
负责 跟 踩 对 象 的 长 度 和 对 齐 要 求 。 联 合 提供 了 一 种 方式 ， 以 在 单 块 存 
储 区 中 管理 不 同类 型 的 数据 ， 而 不 需要 TERE PAE) La BR 
的 信息 。 它 类 似 于 Pascal 语言 中 的 变 体 记录 。 


我 们 来 看 一 个 例子 (可 以 在 编译 万 的 符号 表 管 理 程序 中 找到 该 例子 ) 。 
假设 一 个 常量 可 能 是 int ` float 或 字符 指针。 特定 类 型 的 第 量 值 必须 
保存 在 合适 类 型 的 变量 中 ， 然 而 ， 如 采 该 常量 的 不 同类 型 占据 相同 大 
小 的 存储 空间 ， 且 保存 在 同一 个 地 方 的 话 ， 表 管理 将 最 方便 。 这 束 是 
联合 的 目的 一 一 一 个 变量 可 以 合法 地 保存 多 种 数据 类 型 中 任何 一 种 类 
型 的 对 象 。 其 语 法 基于 结构 ， 如 下 所 示 : 


Treeptr 类 型 显然 


union u_tag { int ival; float fval; char *sval; 

}u; 

变量 u 必须 足够 大 ， 以 保存 这 3 种 类 型 中 最 大 的 一 种 ， 具 体 长 度 同 具 
体 的 实现 有 关 。 这 些 类 型 中 的 任何 一 种 类 型 的 对 象 都 可 赋值 给 u， 且 
可 使 用 在 随后 的 表达 式 中 ， 但 必须 保证 是 一 致 的 : 读 取 的 类 型 必须 是 最 
近 一 次 存 入 的 类 型 。 程 序 员 负责 跟踪 当前 你 存在 联合 中 的 类 型 。 如 果 
保存 的 类 型 与 读 取 的 类 型 不 一 致 ， 其 结果 取决 于 具体 的 实现 。 

可 以 通过 下 列 语法 访问 联合 中 的 成 员 : 

联合 名 .成 员 


或 
联合 指针 > 成 员 


它 与 访问 结构 的 方式 相同 。 如 果 用 变量 utype 跟 踩 保存 在 u 中 的 当前 
数据 类 型 ， 则 可 以 像 下 面 这 样 使 用 联合 : 


if (utype == INT) printf("%d\n", u.ival); 


if (utype == FLOAT) printf("%f\n", u.fval); 

if (utype == STRING) printf("%s\n", u.sval); 

else 

printf("bad type %d in utype\n", utype); 

联合 可 以 使 用 在 结构 和 数组 中 ， 反 之 亦 可 。 访 问 结构 中 的 联合 (或 反 


之 ) 的 某 一 成 员 的 表示 法 与 舱 套 结构 相同 。 人 例如， 假定 有 下 列 的 结构 
数组 定义 : 


struct { 

char *name; int flags; int utype; union { 

int ival; float fval; char *sval; 

} u; 

} symtab[NSYM]; 

可 以 通过 下 列 语句 引用 其 成 员 ival: symtab[i].u.ival 

也 可 以 通过 下 列 语句 之 一 引用 字符 串 sval 的 第 一 个 字符 : 

*symtab[i].u.sval symtab[i].u.sval[0] 

实际 上 ， 联 合 就 是 一 个 结构 ， 它 的 所 有 成 员 相对 于 基地 址 的 偏 移 量 都 

为 0， 此 结构 空间 要 大 到 足够 容纳 最 " 视 '" 的 成 员 ， 并 且 ， 其 对 齐 方式 

要 适合 于 联合 中 所 有 类 型 的 成 员 。 对 联合 允许 的 操作 与 对 结构 允许 的 
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联合 只 能 用 其 第 一 个 成 员 类 型 的 值 进 行 初始 化 ， 因 此 ， 上 述 联 合 u 只 
能 用 整数 值 进行 初 始 化 。 


第 8 章 的 存储 分 配 程序 将 说 明 如 何 使 用 联合 来 强制 一 个 变量 在 特定 类 
型 的 存储 边界 上 对 齐 。 


6.9 位 字段 


在 存储 空间 很 宝 贯 的 情况 下 ， 有 可 能 需要 将 多 个 对 象 保存 在 一 个 机 器 
字 中 。 一 种 常用 的 方法 十， 使 用 类 似 于 编译 占 符 号 表 的 单个 二 进 制 位 
标志 集合 。 外 部 强加 的 数据 格式 (如 硬件 设备 接口 ) 也 经 常 需要 从 字 的 
部 分 值 中 读 取 数据 。 


考虑 编译 器 中 符号 表 操作 的 有 关 细 厄 。 程 序 中 的 每 个 标识 符 都 有 与 之 
相关 的 特定 信息 ， 例 如 ， 它 是 否 为 关键 字 ， 它 是 否 是 外 部 的 且 ( 或 ) 是 


静态 的 ， 人 对 这 些 信息 进行 编码 的 最 简洁 的 方法 就 是 使 用 一 个 
char 或 int 对 象 中 的 位 标志 和 集合。 


采用 的 方法 是 ， 定 义 一 个 与 相关 位 的 位 置 对 应 的 "屏蔽 码 " 集 合 ， 
H: 


#define KEYWORD 01 

#define EXTRENAL 02 

#define STATIC 04 

或 

enum { KEYWORD = 01, EXTERNAL = 02, STATIC = 04 }; 


这 些 数字 必须 是 2 的 军 。 这 样 ， 访 问 这 些 位 就 变 成 了 用 第 2 章 中 描述 
的 移 位 运算 、 屏 项 运算 及 补 码 运算 进行 简单 的 位 操作 。 


下 列 语句 在 程序 中 经 冲 出 现 : 


flags |= EXTERNAL | STATIC; 

该 语句 将 flags 中 的 EXTERNAL 和 STATIC 位 置 为 1， 而 下 列 语句: 
flags &= ~(EXTERNAL | STATIC); 

则 将 它们 置 为 0。 并 且 ， 当 这 两 位 都 为 0 时 ， 下 列表 达 式 : 

if ((flags & (EXTERNAL | STATIC)) == 0) .… 

的 值 为 真 。 

尽管 这 些 方法 很 容易 掌握 ， 但 是 ，C 语言 仍然 提供 了 另 一 种 可 替代 的 
方法 ， 即 直接 定义 和 访问 一 个 字 中 的 位 字段 的 能 力 ， 而 不 需要 通过 按 
位 逻辑 运算 符 。 位 字段 (bit*field)， 或 简称 字 段 ， 是 " 字 " 中 相 邻 位 的 集 


合 。" 子 "(word) 是 单个 的 存储 单元 ， 它 同 具 体 的 实现 有 关 。 例 如， 上 
述 符 号 表 的 多 个 #define 语句 可 用 下 列 3 SBA RE SOR IVE: 


struct { 


unsigned int is_keyword : 1; unsigned int is_extern : 1; unsigned int 
is_ Static : 1; 


} flags; 

这 里 定义 了 一 个 变量 fags， 它 包含 3 个 一 位 的 字段 。 冒 号 后 的 数字 表 
示 字 段 的 宽度 (用 二 进 制 位 数 表 示 )。 字 段 被 声明 为 unsigned int 类 型 ， 
以 保证 它们 是 无 符号 量 。 

单个 字段 的 引用 方式 与 其 它 结 构成 员 相 同 ， 例 如 : flags.is_keyword ` 
flags.is_extern 等 等 。 字 段 的 作用 与 小 整数 相似 。 同 其 它 整数 一 样 ， 字 
人 表达 式 中 。 因 此 ， 上 面 的 例子 可 用 更 目 然 的 方式 表达 


flags.is_extern = flags.is_static = 1; 该 语句 将 is_extern 和 is_static 位 置 为 
1° 下 列 语句 : flags.is_extern = flags.is_static = 0; 


将 is_extern 和 is_static 位 置 为 0。 下列 语 句 : 


if (flags.is_extern == 0 && flags.is_static == 0) 


用 于 对 is_extern 和 is_static 位 进行 测试 。 字段 的 所 有 属性 几乎 都 同 具 
体 的 实现 有 关 。 字 段 是 否 能 禾 盖 字 边 界 由 具体 的 实现 定义 。 


字段 可 以 不 命名 ， 无 名 字段 (只 有 一 个 冒号 和 宽度 ) 起 填充 作用 。 特 殊 
宽度 0 可 以 用 来 强制 
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某 些 机 器 上 字段 的 分 配 是 从 字 的 左 端 至 右 端 进行 的 ， 而 某 些 机 器 上 则 
相反 。 这 意味 着 ， 尽管 字段 对 维护 内 部 定义 的 数据 结构 很 有 用 ， 但 在 
选择 外 部 定义 数据 的 情况 下 ， 必 须 仔细 考 虑 哪 端 优先 的 问题 。 依 赖 于 
这 些 因素 的 程序 是 不 可 移植 的 。 字 段 也 可 以 仅仅 声明 为 nt， 为 了 方 
便 移 植 ， 需 要 显 式 声 明 该 int 类 型 是 signed 还 是 unsigned 类 型 。 字 段 
不 是 数组 ， 并 且 没 有 地 址 ， 因 此 对 它们 不 能 使 用 & 运算 符 。 


第 7 章 输入 与 输出 


输入 /输出 功能 并 不 是 C 语言 本 映 的 组 成 部 分 ， 所 以 到 目前 为 止 ， 我们 
并 没有 过 多 地 强 调 它们 。 但 是 ， 程 序 与 环境 之 间 的 交互 比 我 们 在 前 面 
部 分 中 描述 的 情况 要 复杂 很 多 ， 本 章 将 讲述 标准 库 ， 介 绍 一 些 输 入 / 输 
出 画 数 、 字 符 串 处 理 函 数 、 存 储 管理 函数 与 数学 函数 ， 以 及 其 它 一 些 
C 语言 程序 的 功能 。 本 章 讨论 的 重点 将 放 在 输入 /输出 上 。 


ANSI 标准 精确 地 定义 了 这 些 库 范 数 ， 所 以 ， 在 任何 可 以 使 用 C 语言 
的 系统 中 部 有 这 些 函 数 的 兼容 形式 。 如 采 程 序 的 系统 交互 部 分 仅仅 使 
yee 则 可 以 不 经 修改 地 从 一 个 系统 移植 到 为 一 个 


这 些 库 函 数 的 属性 分 别 在 十 多 个 头 文件 中 声明 ， 前 面 已 经 遇 到 过 一 部 
分 ， 如 <stdio.h>、 


<string.h> 和 <ctype.h>。 我 们 不 打算 把 整个 标准 库 都 罗列 于 此 ， 因 为 我 
们 更 关心 如 何 使 


用 标准 库 编写 C 语言 程序 。 附 录 B 对 标准 库 进 行 了 详细 的 描述 。 
7.1 标准 输入 /输出 

我 们 在 第 工 章 中 讲 过 ， 标 准 库 实现 了 简单 的 文本 输入 /输出 模式 。 文 本 
流 由 一 系列 行 组 成 ， 每 一 行 的 结尾 是 一 个 换行 符 。 如 果 系 统 没有 遵循 
这 种 模式 ， 则 标准 库 将 通过 一 些 措施 使 得 该 系统 适应 这 种 模式 。 例 
如 ， 标 准 库 可 以 在 输入 端 将 回 车 符 和 换行 符 都 转换 为 换行 符 ， 而 在 输 
出 端 进 行 反 向 转换 。 

最 简单 的 输入 机 制 是 使 用 getchar 画 数 从 标准 输入 中 (一 般 为 键盘 ) 一 次 
读 取 一 个 字符 : 


int getchar(void) 


getchar 函数 在 每 次 被 调用 时 返回 下 一 个 输入 字符 。 知 遇 到 文件 结尾 ， 
则 返回 EOF。 符 号 常 量 EOF 在 头 文件 <stdio.h> 中 定义 ， 其 值 一 般 为 


。 工 ， 但 程序 中 应 该 使 用 EOF 来 测试 文件 是 否 结束 ， 这 样 才能 保证 程序 
同 EOF 的 特定 值 无 关 。 


在 许多 环境 中 ， 可 以 使 用 符号 < 来 实现 输入 重 定 癌 ， 它 将 把 键盘 输入 
替换 为 文件 输入 :如 果 程 序 prog 中 使 用 了 函数 getchar， 则 命令 行 


prog < infile 


将 使 得 程序 prog 从 输入 文件 infile( 而 不 是 从 键盘 ) 中 读 取 字 符 。 实 际 
上 ,程序 prog 本 号 并 不 在 意 输 入 方式 的 改变 ， 并 且 ， 了 字符 串 " 
<infile" 也 并 不 包含 在 argv 的 命令 行 参数 中 。 如 果 输 入 通过 管道 机 制 
来 自 于 男 一 个 程序 ， 那 么 这 种 输入 切换 也 是 不 可 见 的 。 比 如 ， 在 某 些 
A Pole: 


otherprog | prog 


将 运行 两 个 程序 otherprog 和 prog， 并 将 程序 otherprog 的 标准 输出 通 
过 管道 重 定 辐 到 程序 prog 的 标准 输入 上 。 
EKI 


AR 


<T 


int putchar(int) 


用 于 输出 数据 。putchar(c) 将 字符 c 送 至 标准 输出 上 ， 在 默认 情况 下 ， 
标准 输出 为 屏幕 显 示 。 如 果 没 有 发 生 错误 ， 则 函数 putchar 将 返 同 输 
出 的 字符 ;如 果 发 生 了 错误 ， 则 返回 EOF。 同样 ， 通 常情 况 下 ， 也 可 
以 使 用 “ > 输出 文件 名 "的 格式 将 输出 重 定 同 到 某 个 文件 中 。 例 如 ， 如 
果 程 序 prog 调用 了 函数 putchar， 那 么 命令 行 


prog > 输出 文件 名 
将 把 程序 prog 的 输出 从 标准 输出 设备 重 定向 到 文件 中 。 如 果 系 统 支 持 


管道 ， 那 么 命令 行 


prog | anotherprog 


将 把 程序 prog 的 输出 从 标准 输出 通过 管道 重 定 问 到 程序 anotherprog 
的 标准 输入 中 。 函数 printf 也 癌 标准 输出 设备 上 输出 数据 。 我 们 在 程 
序 中 可 以 交叉 调用 函数 putchar 


和 printf， 输 出 将 按照 画 数 调用 的 先后 顺序 依次 产生 。 


J 出 麻 芳 数 的 每 个 源 程 序 文件 必须 在 引用 这 些 琅 数 之 前 包含 
| 语 in 


#include <stdio.h> 


当 文 件 名 用 一 对 尖 括 号 < 和 > 括 起 来 时 ， 预 处 理 器 将 在 由 具体 实现 定义 
的 有 关 位 置 中 查找 指定 的 文件 (例如 ， 在 UNIX 系统 中 ， 文 件 一 般 放 
在 目录 /usr/include F) ° 


许多 程序 只 从 一 个 输入 流 中 读 取 数据 ， 并 且 只 和 同一 个 输出 流 中 输出 数 

据 。 对 于 这 样 的 程序 ， 只 需要 使 用 函数 getchar ` putchar 和 printf 实现 
输入 /输出 即 可 ， 并 且 对 程序 来 说 已 经 足够 了 。 特 别 是 ， 如 果 通 过 重 定 
回 将 一 个 程序 的 输出 连接 到 另 一 个 程序 的 输入 ， 仅 仅 EAA E R 
o 例如， 考虑 下 列 程 序 lower， 它 用 于 将 输入 转换 为 小 写字 母 

J 


#include <stdio.h> 


#include <ctype.h> 

main() /* lower: convert input to lower case*/ 

{ 

int c 

while ((c = getchar()) != EOF) putchar(tolower(c)); 

return 0; 

} 

EAN tolower EAX HF <ctype.h> PEN, 它 把 大 写字 母 转换 为 小 写 形 
式 ， 并 把 其 它 字符 原样 返回 。 我 们 在 前 面 提 到 过 ， 头 文件 <stdio.h> 中 
的 getchar 和 putchar" KZ” 以 及 <ctype.h> 中 的 ”tolower "函数 "一 般 都 
是 安 ， 这 样 现 避 免 了 对 每 个 字符 都 进行 男 数 调 用 的 开销 。 我 们 将 在 
8.5 世 介 绍 它们 的 实现 方法 。 无 论 <ctype.h> 中 的 函数 在 给 定 的 机 器 上 
是 如 何 实现 的 ， 使 用 这 些 函 数 的 程序 都 不 发 了 解 字符 集 的 知识 。 
练习 7.1 编写 一 个 程序 ， 根 据 它 自身 被 调用 时 存放 在 argv[0] 中 


的 名 字 ， 实 现 将 大 写字 母 转换 为 小 写字 母 或 将 小 写字 母 转 换 为 大 写字 
母 的 功能 。 


7.2 格式 化 输出 printf 函数 


输出 函数 printf 将 内 部 数值 转换 为 子 符 的 形式 。 前 面 的 有 关 章 让 中 已 
经 使 用 过 该 函数 。 


下 面 只 讲述 该 函数 最 典型 的 用 法 ， 附 好 B 中 给 出 了 该 函数 完整 的 摘 


述 o 
int printf(char *format, arg1, arg2, ...); 


函数 printf 在 输出 格式 format 的 控制 下 ， 将 其 参数 进行 转换 与 格式 
化 ， 并 在 标准 输出 设 备 上 打印 出 来 。 它 的 返回 值 为 打印 的 字符 数 。 
格式 字符 串 包含 两 种 类 型 的 对 和 象 :普通 字符 和 转换 说 明 。 在 输出 时 ， 普 
通 字符 将 原样 不 动 地 复制 到 输出 流 中 ， 而 转换 说 明 并 不 直接 输出 到 输 
出 流 中 ， 而 征用 于 控制 printf 中 参数 的 转换 和 打印 ， 每 个 转换 说 明 都 
由 一 个 百 分 号 字符 ( 即 %) 开 始 ， 并 以 一 个 转换 字符 结束 。 在 字符 % 和 
转换 字符 中 间 可 能 依次 包含 下 列 组 成 部 分 : 

负 号 ， 用 于 指定 被 转换 的 参数 按照 左 对 齐 的 形式 输出 。 

数 ， 用 于 指定 最 小 字段 宽度 。 转 换 后 的 参数 将 打印 不 小 于 最 
小 字段 宽度 的 字段 。 如 果 有 必要 ， 了 字段 左边 (如 果 使 用 左 对 齐 的 方 
式 ， 则 为 右边 ) 多 余 的 字符 位 置 用 空格 
填充 以 你 证 最 小 字段 宽 。 

小 数 点 ， 用 于 将 字段 宽度 和 精度 分 开 。 


= 
RE, SPSS RENEE, RTGS AER ET ENA 、 
浮 点 数 小 数 点 后 的 位 数 、 整 型 最 少 输出 的 数字 数目 。 


字母 h 或 1 FRED 表 不 将 整数 作为 short KRÆFT, FEK 
示 将 整数 作为 long 


类 型 打印 。 


R 791 列 出 了 所 有 的 转换 字符 ， 如 采 % 后 面 的 字符 不 十 一 个 转换 说 
明 ， 则 该 行为 是 未 定义 的 。 


表 7.1 printf 函数 基本 的 转换 说 明 


tlt 


符 参数 类 型 :输出 形式 
oio int 类 型 ;十 进 制 数 
int 类 型 ;无 符号 八进制 数 ( 没 有 前 导 0) 


“x int RAY CTS 上 六 进 制 数 (没有 前 导 Ox BK OX), 10@15 分 别 用 
abcdef 或 ABCDEF 表示 


int 类 型 ;无 符号 十 进 制 数 

int 类 型 ;单个 字符 

char * 类 型 ;顺序 打印 字符 串 中 的 字符 ， 直 到 过 到 "0' 或 已 打印 了 由 
精度 指定 的 字符 数 为 止 ' ”double 类 型 ;十 进 制 小 数 [:]m.dddddd， 其 中 
d 的 个 数 由 精度 指定 (默认 值 为 6) 


“double 38 #4;[+]m.dddddd e +xx 或 [*]m.dddddd E +xx， 其 中 d 的 个 
数 由 精度 指定 (默认 值 为 6) 


ss double 类 型 ;如 果 指 数 小 于 .4 或 大 于 等 于 精度 ， 则 用 %e 或 %E 格 
式 输 出 ， 否 则 用 %f 格式 输出 。 尾 部 的 0 和 小 数 点 不 打印 


” void * 类 型 ;指针 (取决 于 具体 实现 ) 


不 转换 参数 ;打印 一 个 百 分 号 % 

在 转换 说 明 中 ， 宽 度 或 精度 可 以 用 星 号 * 表 示 ， 这 时 ， 宽 度 或 精度 的 值 
通过 转换 下 一 参数 (必须 为 int 类 型 ) 来 计算 。 例 如 ， 为 了 从 字符 串 s 中 
打印 最 多 max 个 字符 ， 可 以 使 用 下 列 语句 : 


printf(""%.*s", max, s); 


前 面 的 章 市 中 已 经 介绍 过 大 部 分 的 格式 转换 ， 但 没有 介绍 与 字符 串 相 
天 的 精度 。 下 表 说 明了 在 打印 字符 串 "hello, world"(12 个 字符 ) 时 根据 


不 同 的 转换 说 明 产 生 的 不 同 结 末 。 我 们 在 每 个 字段 的 左边 和 右边 加 上 
冒号 ， 这 样 可 以 清晰 地 表示 出 字段 的 宽度 。 


:%s: :hello, world: 


:%10s: :hello, world: 

:%.10s: :hello, wor: 

:%10s: :hello, world: 

:%.15s: :hello, world: 

:%e15s: :hello, world 
:°%15.10s: : hello, wor: 
:%*15.10s: :hello, wor 


注意 : 画 数 printf 使 用 第 一 个 参数 判断 后 面 参数 的 个 数 及 类 型 。 如 果 参 
数 的 个 数 不 够 或 者 夫 型 销 误 ， 则 将 得 到 错误 的 结 末 。 请 注意 下 面 两 个 
函数 调用 之 间 的 区 别 : 
printf(s); /* FAILS if s contains % */ printf(""%s", s); 

/* SAFE */ 


HAL Pn 执行 的 转换 和 函数 printf 相同 ， 但 它 将 输出 保存 到 一 个 字 


A 


AY 


int sprintf(char “string, char *format, arg1, arg2, ...); sprintf 函数 和 printf 
Kat, IZR format 格式 格式 化 参数 序列 argi > arg2> , 


但 它 将 输出 结果 存放 到 string 中 ， 而 不 是 输出 到 标准 输出 中 。 当 然 ， 
string 必须 足够 大 以 
存放 输出 结果 。 


练习 7.2 编写 一 个 程序 ， 以 合理 的 方式 打印 任何 输入 。 该 程序 至 少 能 
REIRIS EOU GERBER, FRK 
fi ° 


7.3 变 长 参数 表 


AP DASE EW ERX printf 的 一 个 最 简单 版 本 为 例 ， 介 绍 如 何以 可 移植 的 
方式 编写 可 处 理 变 长 参数 表 的 函数 。 因 为 我 们 的 重点 在 于 参数 的 处 
H, ATLL, KZI minprintf 只 处 理 格式 字 符 串 和 人 参数， 格式 转换 则 通过 
调用 函数 printf 实现 。 


函数 printf 的 正确 声明 形式 为 : 


int printf(char *fmt, ...) 
其 中 ， 省 略 号 表示 参数 表 中 参数 的 数量 和 类 型 是 可 变 的 。 省 略 号 只 能 


出 现在 参数 表 的 尾部 。 因为 minprintf 函数 不 需要 像 printf 函数 一 样 返 
回 实 际 和 输出 的 字符 数 ， 因 此 ， 我 们 将 它 声明 为 下 列 形式 : 


void minprintf(char *fmt, ...) 


编写 函数 minprintf 的 关键 在 于 如 何 处 理 一 个 甚至 连 名 字 都 没有 的 参数 
表 。 标 准 头 文件 


<stdarg.h) 中 包含 一 组 宕 定义 ， 它 们 对 如 何 过 历 参 数 表 进行 了 定义 。 该 
头 文件 的 实现 因 不 


同 的 机 怖 而 不 同 ， 但 提供 的 接口 是 一 致 的 。 


va_list 类 型 用 于 声明 一 个 变量 ， 该 变量 将 依次 引用 各 参数 。 在 函数 
minprintf F, 我 们 将 该 变量 称 为 ap， 意思 是 "参数 指针 "。 安 va_start 
将 ap 初始 化 为 指向 第 一 个 无 名 参数 的 指针 。 在 使 用 ap 之 前 ， 该 宏 必 
须 被 调用 一 次 。 参 数 表 必须 至 少 包 括 一 个 有 名 参数 ， va_start 将 最 后 
一 个 有 名 参数 作为 起 点 。 


每 次 调用 va_arg， 该 男 数 都 将 返回 一 个 参数 ， 并 将 ap 指 癌 下 一 个 参 
数 。va_arg 使 用 一 个 类 型 名 来 决定 返回 的 对 象 类 型 、 指 针 移 动 的 步 
最 后 ， 必 须 在 函数 返回 之 前 调用 va_end， 以 完成 一 些 必 要 的 清理 
工作 。 


基于 上 面 这 些 讨 论 ， 我 们 实现 的 简化 printf 函数 如 下 所 示 : 
#include <stdarg.h> 


/* minprintf: minimal printf with variable argument list */ void 
minprintf(char *fmt, ...) 


{ 
va_list ap; /* points to each unnamed arg in turn */ char *p, *sval; 
int ival; double dval; 


va_start(ap, fmt); /* make ap point to 1st unnamed arg */ for (p = fmt; *p; 
pt+) { 


if (*p != '%') { putchar(*p); continue; 

} 

switch (*++p) { case 'd': 

ival = va_arg(ap, int); printf("%d", ival); break; 
case 'f': 

dval = va_arg(ap, double); printf("%f", dval); 
break; case 's': 

for (sval = va_arg(ap, char *); *sval; sval++) putchar(*sval); 
break; default: 

putchar(*p); break; 

} 

} 


va_end(ap); /* clean up when done */ 
} 


练习 793 改写 minprintf 函数 ， 使 它 能 完成 printf 函数 的 更 多 功 
能 。 


7.4 格式 化 输入 一 一 scanf 函数 


输入 函数 scanf 对 应 于 输出 函数 printf， 它 在 与 后 者 相反 的 方向 上 提供 
同样 的 转换 功 能。 具有 变 长 参数 表 的 函数 scanf 的 声明 形式 如 下 : 


int scanf(char *format, ...) 


scanf 函数 从 标准 输入 中 读 取 字符 序列 ， 按 照 format 中 的 格式 说 明 对 字 
符 序 列 进行 解释 ， 并 把 结果 保存 到 其 余 的 参数 中 。 格 式 参 数 format 将 
在 接 下 来 的 内 容 中 进行 讨论 。 其 它 所 有 参数 都 必须 是 指针 ， 用 于 指定 
经 格式 转换 后 的 相应 输入 保存 的 位 置 。 和 上 市 讲述 printf — FE, ASTI 
只 介绍 scanf 函数 最 有 用 的 一 些 特征 ， 而 并 不 完整 地 介绍 。 


当 scanf 函数 扫描 完 其 格式 哩 ， 或 者 健 到 某 些 输入 无 法 与 格式 控制 说 
明 匹 配 的 情况 时 ， 该 函数 将 终止 ， 同 时 ， 成 功 匹配 并 赋值 的 输入 页 的 
个 数 将 作为 函数 值 返 回 ， 所 以 ， 该 函数 的 


返回 值 可 以 用 来 确定 已 匹配 的 输入 页 的 个 数 。 如 果 到 达 文 件 的 结尾 ， 

该 函数 将 返回 EOF。 注 意 ， 返 回 EOF 与 0 是 不 同 的 ，0 表示 下 一 个 输 
入 字符 与 格式 串 中 的 第 一 个 格式 说 明 不 匹配 。 下 一 次 调用 scanf 函数 
将 从 上 一 次 转换 的 最 后 一 个 字符 的 下 一 个 字符 开始 继续 搜索 。 


另外 还 有 一 个 输入 函数 ”sscanf， 它 用 于 从 一 个 字符 串 ( 而 不 是 标准 输 
入 ) 中 读 取 字符 序 列 : 


int sscanf(char *string, char *format, arg1, arg2, ...) 


它 按照 格式 参数 format 中 规定 的 格式 扫描 字符 种 sting， 并 把 结果 分 
别 保存 到 arg 、arg2 、 这 些 参数 中 。 这 些 参数 必须 是 指针 


人 用 于 控制 输入 的 转换 。 格 式 串 可 能 包含 
| 部 分 : 


空格 或 制 表 符 ， 在 处 理 过 程 中 将 被 忽略 。 
普通 字符 (不 包括 9)， 用 于 匹配 输入 流 中 下 一 个 非 空白 符 字 


pa 


oe 


转换 说 明 ， 依 次 由 一 个 %、 一 个 可 选 的 赋值 禁止 字符 *、 一 个 
可 选 的 数值 (指定 最 大 字段 宽度 )、 一 个 可 选 的 h、`1 或 工 字符 (指定 目 
标 对 象 的 宽度 ) 以 及 一 个 转换 字符 


组 成 。 


转换 说 明 探 制 下 一 个 输入 字段 的 转换 。 一 般 来 说 ， 转 换 结果 存放 在 相 
应 的 参数 指向 的 变 量 中 。 但 是 ， 如 果 转 换 说 明 中 有 赋值 禁止 字符 *， 

则 跳 过 该 输入 字段 ， 不 进行 赋值 。 输 入 字段 定义 为 一 个 不 包括 空白 符 
的 字符 串 ， 其 边界 定义 为 到 下 一 个 空白 符 或 达到 指定 的 字段 宽度 。 这 
表明 scanf 函数 将 越过 行 边界 读 取 输入 ， 因 为 换行 符 也 是 空白 符 。( 空 
人 
HIF) ° 


转换 字符 指定 对 输入 字段 的 解释 。 对 应 的 参数 必须 是 指 针 ， 这 也 是 C 
语言 通过 值 调 用 语 义 所 要 求 的 。 表 792 中 列 出 了 这 些 转换 字符 。 


表 7。2 scanf 函数 的 基本 转换 说 明 


al 


符 输入 数据 ;参数 类 型 

4。 十 进 制 整数 ;int* 类 型 

整数 ;int* 类 型 ， 可 以 是 八进制 (以 0 开头 ) 或 十 六 进 制 (以 0x BK OX 
开头 ) 


八进制 整数 (可 以 以 0 开头 ， 也 可 以 不 以 0 开头 );int*# 类 型 
无 符号 十 进 制 整数 ;unsigned int * 类 型 


有 Ox 或 0X 开 头 ， 也 可 以 不 以 0x BK OX 开头 );int 
sA 


”字符 ;char * 类 型 ， 将 接 下 来 的 多 个 输入 字符 (于 认为 1 个 字符 ) 存 
放 到 指定 位 置 。 该 转换 规范 通常 不 跳 过 空 日 符 。 如 果 需 要 读 入 下 一 个 
非 空 日 符 ， 可 以 使 用 %1s 


字符 种 (不 加 引号 ):char * 类 型 ， 指 向 一 个 足以 存放 该 字符 串 (还 包 
括 尾部 的 字符 \0) 的 字符 数组 。 字 符 串 的 末尾 将 被 添加 一 个 结束 符 \0 


eee 浮 点 数 ， 它 可 以 包括 正 负 号 (可 选 )、 小 数 点 (可 选 ) 及 指数 部 分 
(可 选 );float ”* 类 型 


字符 %; 不 进行 任何 赋值 操作 


转换 说 明 di、 ou 及 x 的 前 面 可 以 加 上 字符 h 或 1。 前 绥 h 表明 参 

数 表 的 相应 参数 是 一 个 指 问 short 类 型 而 非 int 类 型 的 指针 ， 前 级 1 表 
明 参 数 表 的 相应 参数 是 一 个 指 朵 long 类 型 的 指针 。 类 似 地 ， 转 换 说 明 
e、f 和 gg 的 前 面 也 可 以 加 上 前 级 1， 它 表明 参数 表 的 相应 参数 是 一 个 

4] double 类 型 而 非 float 类 型 的 指针 。 


来 看 第 一 个 例子 。 我 们 通过 函数 scanf 执行 输入 转换 来 改写 第 4 章 中 
的 簿 单 计算 需 程序 ， 


如 下 所 示 : 

#include <stdio.h> 

main() /* rudimentary calculator */ 
{ 

double sum, v; 

sum = 0; 


while (scanf("%lf", &v) == 1) printf("\t%.2f\n", sum += v); 


return 0; 

} 

假设 我 们 要 读 取 包含 下 列 日 期 格式 的 输入 行 : 
25 Dec 1988 


相应 的 scanf 语句 可 以 这 样 编写 : 

int day, year; 

char monthname[20]; 

scanf("%d %s %d", &day, monthname, &year); 

因为 数组 名 本 身 就 是 指针 ， 所 以 ，monthname 的 前 面 没有 取 地 址 运算 
符 &。 字符 字面 值 也 可 以 出 现在 scanf 的 格式 串 中 ， 它 们 必须 与 输入 
中 相同 的 字符 匹配 。 因 此 ， 

我 们 可 以 使 用 下 列 scanf 语句 读 入 形 如 mm/dd/yy 的 日 期 数据 : 


int day, month, year; 


scanf("%d/%d/%d", &month, &day, &year); 


scanf 函数 忽略 格式 串 中 的 空格 和 制 表 符 。 此 外 ， 在 读 取 输 入 值 时 ， 它 
将 路 过 至 日 竺 ( 空 格 、 制 表 符 、 换 行 符 等 等 )。 如 采 要 读 取 格式 不 固定 
的 输入 ， 节 好 每 次 读 入 一 行 ， 然 后 再 用 sscanf 将 合适 的 格式 分 离 出 来 
读 和 信 。 例 如 ， 假 定 我 们 需要 读 取 一 些 包含 日 期 数据 的 输入 行 ， 日 期 的 
格式 可 能 是 上 述 任 一 种 形式 。 我 们 可 以 这 样 编写 程序 : 


while (getline(line, sizeof(line)) > 0) { 


if (sscanf(line, "%d %s %d", &day, monthname, &year) == 3) printf("valid: 
%s\n", line); /* 25 Dec 1988 form */ 


else if (sscanf(line, "%d/%d/%d", &month, &day, &year) == 3) 
printf("valid: %s\n", line); /* mm/dd/yy form */ 


else 

printf("invalid: %s\n", line); /* invalid form */ 

} 

scanf 函数 可 以 和 其 它 输入 函数 混合 使 用 。 无 论调 用 哪个 输入 函数 ， 下 
eee 调用 将 从 scant 没有 读 取 的 第 一 个 字符 处 开始 读 取 数 


注意 ，scanf 和 sscanf 函数 的 所 有 参数 都 必须 是 指针 。 最 常见 的 错误 是 
将 输入 语句 写 成 下 列 形式 .: 


scanf("%d", n); 
正确 的 形式 应 该 为 : 


scanf("%d", &n); 


Da Ea CES EY — A hl) ARAR ER © 


练习 724 类 似 于 上 一 太 中 的 函数 minprintf, 485 scanf 函数 的 一 
个 简化 版 本 。 练习 795 NSS 4 Rat Rate, A 
scanf 函数 和 (或 )sscanf 函数 实 


现 输入 以 及 数 的 转换 。 
7.5 文件 访问 


到 目前 为 止 ， 我 们 讨论 的 例子 都 是 从 标准 输入 读 取 数据 ， 并 向 标准 输 
p 输出 数据 。 标 准 输入 和 标准 输出 是 操作 系统 目 动 提 供给 程序 访问 


接 下 来 ， 我 们 编写 一 个 访问 文件 的 程序 ， 且 它 所 访问 的 文件 还 没有 连 
接 到 该 程序 。 程 序 cat 可 以 用 来 说 明 该 问题 ， 它 把 一 批 命名 文件 串联 

后 输出 到 标准 输出 上 。cat 可 用 来 在 屏幕 上 打印 文件 ， 对 于 那些 无 法 

通过 名 字 访 问 文件 的 程序 来 说 。 它 还 可 以 用 作 通 用 的 输入 收集 器 。 例 
MH, ST: 


cat X.C y.c 


将 在 标准 输出 上 打印 文件 xc 和 yc 的 内 容 。 问题 在 于 ， 如 何 设计 命 
名 文件 的 读 取 过 程 昵 ? 换 名 话说， 如何 将 用 户 需要 使 用 的 文件 的 


外 部 名 同 读 取 数 据 的 语句 关联 起 来 。 


方法 其 实 很 简单 。 在 读 写 一 个 文件 之 前 ， 必 须 通过 库 函 数 fopen 打开 
该 文件 。fopen 用 类 似 于 xc 或 y.c 这 样 的 外 部 名 与 操作 系统 进行 某 些 
必要 的 连接 和 通信 (我 们 不 必 关 心 这 些 细节 )， 并 返回 一 个 随后 可 以 用 
于 文件 读 写 操作 的 指针 。 


该 指针 称 为 文件 指针 ， 它 指向 一 个 包含 文件 信息 的 结构 ， 这 些 信息 包 

括 : 缓 冲 区 的 位 置 、 缓 冲 区 中 当前 字符 的 位 置 、 文 件 的 读 或 写 状态 、 是 
人 否 出 错 或 是 否 已 经 到 达 文 件 结尾 等 等 。 用 户 不 必 关 心 这 些 细节 ， 因 为 
<stdio.h> 中 已 经 定义 了 一 个 包 全 这 些 信息 的 结构 FILE。 在 程 序 中 只 需 
按照 下 列 方式 声明 一 个 文件 指针 即 可 : 


FILE *fp; 
FILE *fopen(char *name, char *mode); 


在 本 例 中 ，fp 是 一 个 指向 结构 FILE 的 指针 ， 并 且 ，fopen 函数 返回 一 
个 指 癌 结 构 FILE 的 指针 。 注 意 ，FILE & int 一样 是 一 个 类 型 名 ， 而 
不 是 结构 标记 。 它 是 通过 typedef 定义 的 (UNIX 系统 中 fopen 的 实现 
细节 将 在 8.5 节 中 讨论 )。 


在 程序 中 ， 可 以 这 样 调 用 fopen 函数 : 
fp = fopen(name, mode); 


fopen 的 第 一 个 参数 是 一 个 字符 串 ， 它 包含 文件 名 。 第 二 个 参数 是 访问 
模式 ， 也 是 一 个 字符 串 ， 用 于 指定 文件 的 使 用 方式 。 人 允许 的 模式 包括 : 
读 (“I")、 写 (“w") 及 追加 (“a")。 某 些 系统 还 区 分 文本 文件 和 二 进 制 文 
件 ， 对 后 者 的 访问 需要 在 模式 字符 串 中 增加 字符 “ b" 。 


如 有 果 打 开 一 个 不 存在 的 文件 用 于 写 或 追加 ， 该 文件 将 被 创建 (如 有 果 可 能 
的 话 )。 当 以 写 方式 打开 一 个 已 存在 的 文件 时 ， 该 文件 原来 的 内 容 将 
说 覆 盖 。 但 是 ， 如 果 以 奶 加 方式 打开 一 个 文件 ， 则 该 文件 原来 的 内 容 
将 保留 不 变 。 读 一 个 不 存在 的 文件 会 导致 错误 ， 其 它 一 些 操作 也 可 能 
导致 错误 ， 比 如 试图 读 取 一 个 无 读 取 权限 的 文件 。 如 采 发 生 错 误 ， 
fopen 将 返回 NULL 。 


(可 以 更 进一步 地 定位 错误 的 类 型 ， 具 体 方法 请 参见 附 永 B.1 市 中 关 
于 错误 处 理 函 数 的 讨论 。) 


文件 被 打开 后 ， 束 需要 考虑 采用 哪 种 方法 对 文件 进行 读 写 。 有 多 种 方 
法 可 供 考 虑 ， 其 中 ， gete 和 pute 函数 最 为 简单 。getc 从 文件 中 返回 下 
一 个 字符 ， 它 需要 知道 文件 指针 ， 以 确 定 对 哪个 文件 执行 操作 : 


int getc(FILE *fp) 


getc AOKI] fp 指 癌 的 输入 流 中 的 下 一 个 字符 。 如 果 到 达 文 件 尾 或 出 
现 错误 ， 该 函数 将 返 回 EOF, 


pute 是 一 个 输出 函数 ， 如 下 所 示 : 
int putc(int c, FILE *fp) 


RMS c 写 入 到 fp 指 加 的 文件 中 ， 并 返回 写 入 的 字符 。 如 采 发 
生 错 误 ， 则 返回 EOF 。 类 似 于 getchar 和 putchar，getc 和 pute ZIM 
不 是 函数 。 


局 动 一 个 C 语言 程序 时 ， 操 作 系 统 环境 负责 打开 3 个 文件 ， 并 将 这 3 
个 文件 的 指针 提供 给 该 程序 。 这 3 个 文件 分 别 是 标准 输入 、 标 准 输 出 
和 标准 错误 ， 相 应 的 文件 指针 分 别 为 stdin ` stdout 和 stderr， 它 们 在 
<stdio.h> 中 声明 。 在 大 多 数 环境 中 ，stdin 指向 键盘 ， 而 stdout 和 stderr 
JERE e RITA 7.1 厄 的 讨论 中 可 以 知道 ，stdin 和 stdout 可 以 被 
重 定 问 到 文件 或 管道 。 


getchar 和 putchar 函数 可 以 通过 getc、putc、stdin 及 stdout 定义 如 下 : 


#define getchar() getc(stdin) 

#define putchar(c) putc((c), stdout) 

对 于 文件 的 格式 化 输入 或 输出 ， 可 以 使 用 函数 fscanf 和 fprintf ° ‘EA! 
与 scanf 和 printf 函数 的 区 别 仅仅 在 于 它们 的 第 一 个 参数 是 一 个 指 岗 所 
要 读 写 的 文件 的 指针 ， 第 二 个 参 数 是 格式 串 。 如 下 所 示 : 


int fscanf(FILE *fp, char *format, ...) int fprintf(FILE *fp, char *format, ...) 


掌握 这 些 预备 知识 之 后 ， 我 们 现在 吏 可 以 编写 出 将 多 个 文件 连接 起 来 
的 cat 程序 了 。 该 程序 的 设计 思路 和 其 它 许 多 程序 类 似 。 如 采 有 命令 
行 参数 ， 参 数 将 被 解释 为 文件 名 ， 并 按 顺序 逐个 处 理 。 如 来 没有 参 
数 ， 则 处 理 标准 输入 。 


#include <stdio.h> 


/* cat: concatenate files, version 1 */ main(int argc, char *argv[]) 
{ 

FILE *fp; 

void filecopy(FILE *, FILE *) 

if (argc == 1) /* no args; copy standard input */ filecopy(stdin, stdout); 
else 

while(esargc > 0) 


if ((fp = fopen(*++argv, "r")) == NULL) { printf("cat: can't open %s\n, 
*argv); return 1; 


} else { 


filecopy(fp, stdout); fclose(fp); 
} 

return 0; 

} 


/* filecopy: copy file ifp to file ofp */ void filecopy(FILE *ifp, 
FILE *ofp) 


{ 
int c; 


while ((c = getc(ifp)) != EOF) putc(c, ofp); 


} 
文件 指针 stdin 与 stdout 都 是 FILE * 类 型 的 对 象 。 但 它们 是 常量 ， 而 非 
变量 。 因 此 不 能 对 它们 赋值 。 


int fclose(FILE *fp) 


执行 和 fopen 相反 的 操作 ， 它 断 开 由 fopen 函数 建立 的 文件 指针 和 外 
部 名 之 间 的 连接 ， 并 释放 文件 指针 以 供 其 它 文 件 使 用 。 因 为 大 多 数控 
作 系 统 都 限制 了 一 个 程序 可 以 同时 打开 的 文 件数 ， 所 以 ， 当 文件 指针 
不 再 需要 时 就 应 该 释放 ， 这 是 一 个 好 的 编程 习惯 ， 吏 像 我 们 在 cat 程 
序 中 所 做 的 那样 。 对 输出 文件 执行 fclose 还 有 另外 一 个 原因 : 它 将 把 组 
冲 区 中 由 pute 函数 正在 收集 的 输出 写 到 文件 中 。 当 程序 正常 终止 时 ， 
程序 会 自动 为 每 个 打开 的 文件 调用 fclose 函数 。( 如 果 不 需要 使 用 stdin 
7 stdout， 可 以 把 它们 关闭 掉 。 也 可 以 通过 库 函 数 freopen 重新 指定 它 
TED 


7.6 错误 处 理 


stderr 和 exit 


cat 程序 的 错误 处 理 功 能 并 不 完善 。 问题 在 于 ， 如 末 因 为 某 种 原因 而 造 
成 其 中 的 一 个 文 件 无 法 访问 ， 相 应 的 诊断 信息 要 在 该 连接 的 输出 的 末 
尾 才 能 打印 出 来 。 当 输出 到 屏幕 时 ， 这 种 处 理 方 法 尚 可 以 接受 ， 但 如 
果 输 出 到 一 个 文件 或 通过 管道 输出 到 为 一 个 程序 时 ， 束 无 法 接受 了 。 

为 了 更 好 地 处 理 这 种 情况 ， 男 一 个 输出 流 以 与 stdin 和 stdout 相同 的 方 
式 分 派 给 程序 ， 即 stderr。 即 使 对 标准 输出 进行 了 重 定 同 ， 写 到 stderr 
中 的 输出 通常 也 会 显示 在 屏幕 上 。 

下 面 我 们 改写 cat 程序 ， 将 其 出 错 信息 写 到 标准 错误 文件 上 。 


#include <stdio.h> 


/* cat: concatenate files, version 2 */ main(int argc, char *argv[]) 
{ 

FILE *fp; 

void filecopy(FILE *, FILE *); 

char *prog = argv[0]; /* program name for errors */ 


if (argc == 1 ) /* no args; copy standard input */ filecopy(stdin, stdout); 


else 
while ( "argc > 0) 


if ((fp = fopen(*++argv, "r")) == NULL) { fprintf(stderr, "%s: can't open 
%s\n", 


prog, *argv); exit(1); 

} else { 

filecopy(fp, stdout); fclose(fp); 

} 

if (ferror(stdout)) { 

fprintf(stderr, "%s: error writing stdout\n", prog); exit(2); 

} 

exit(0); 

} 

该 程序 通过 两 种 方式 发 出 出 错 信息 。 站 完 ， 将 fprintf 函数 产生 的 诊断 
信息 输出 到 stderr 上 ， 因 此 诊断 信息 将 会 显示 在 屏幕 上 ， 而 不 是 仅仅 
输出 到 管道 或 输出 文件 中 。 诊 断 信 APES argv[0] 中 的 程序 名 ， 
此 ， 当 该 程序 和 其 它 程序 一 起 运行 时 ， 可 以 识别 错误 的 来 源 。 

其 次 ， 程 序 使 用 了 标准 库 函 数 exit， 当 该 函数 被 调用 时 ， 它 将 终止 调 
用 程序 的 执行 。 任 何 调用 该 程序 的 进程 都 可 以 获取 exit 的 参数 值 ， 因 
此 ， 可 通过 另 一 个 将 该 程序 作为 子 进程 的 程序 来 测试 该 程序 的 执行 是 
否 成 功 。 按 照 惯例 ， 返 回 值 0 表示 一 切 正常 ， 而 非 0 返回 值 通常 表示 


出 更 了 异 第 情况 。exit 为 每 个 已 打开 的 输出 文件 调用 fclose 函数 ， 以 
将 缓冲 区 中 的 所 有 输出 写 到 相应 的 文件 中 。 


在 主 程序 main 中 ， 语 句 return expr “fT exit(expr) ° (Hae, EHK 
数 exit 有 一 个 优点 ， 它 可 以 从 其 它 函 数 中 调用 ， 并 且 可 以 用 类 似 于 第 
5 草 中 描述 的 模式 查找 程序 得 找 这 些 调用 。 

如 果 流 fp 中 出 现 错误 ， 则 函数 ferror 返回 一 个 非 0 值 。 

int ferror(FILE *fp) 


尽管 输出 错误 很 少 出 现 ， 但 还 是 存在 的 (例如 ， 当 磁盘 满 时 )， 因 此 ， 
成 熟 的 产品 程序 应 该 检 查 这 种 类 型 的 错误 。 


函数 feof(FILE *)5 ferror 类 似 。 如 果 指 定 的 文件 到 达 文 件 结尾 ， 它 将 
返回 一 个 非 


0 值 。 
int feof(FILE *fp) 
在 上 面 的 小 程序 中 ， 我 们 的 目的 是 为 了 说 明 问 题 ， 因 此 并 不 太 关 心 程 


序 的 退出 状态 ， 但 对 于 任何 重要 的 程序 来 说 ， 都 应 该 让 程序 返回 有 意 
义 且 有 用 的 值 。 


7.7 行 输入 和 行 输出 


人 fgets， 它 和 前 面 几 章 中 用 到 的 函数 getline 


char *fgets(char *line, int maxline, FILE *fp) 


fgets 函数 从 fp THT ASC HR R SEEN RATETA), FRE 
存放 在 字符 数组 


line 中 ， 它 最 多 可 读 取 maxlinesl 个 字符 。 读 取 的 行将 以 \0' 结 尾 保存 到 
数组 中 。 通 常情 况 下 ，fgets 返回 line， 但 如 果 遇 到 了 文件 结尾 或 发 生 
了 错误 ， 则 返回 NULL( 我 们 编写 的 getline 函数 返回 行 的 长 度 ， 这 个 值 
更 有 用 ， 当 它 为 0 时 意味 着 已 经 到 达 了 文件 的 结尾 )。 


输出 函数 fputs 将 一 个 字符 串 ( 不 需要 包含 换行 符 ) 写 入 到 一 个 文件 中 : 
int fputs(char *line, FILE *fp) 

如 有 末 发 生 错误 ， 该 函数 将 返回 EOF， 人 否则 返回 一 个 非 负 值 。 

EKZ gets 和 puts 的 功能 与 fgets 和 fputs 函数 类 似 ， 但 它们 是 对 stdin 
和 stdout 进行 操作 。 有 一 点 我 们 需要 注意 ，gets 函数 在 读 取 字 符 串 时 
Se ee 而 puts KAE E A FA BN ES ES EB ST 
一 个 换行 符 。 


下 面 的 代码 是 标准 库 中 fgets 和 fputs 函数 的 代码 ， 从 中 可 以 看 出 ， 这 
两 个 画 数 并 没 有 什么 特别 的 地 方 。 代 码 如 下 所 未: 


/* fgets: get at most n chars from iop */ char *fgets(char *s, int n, 
FILE *iop) 


{ 

register int c; register char *cs; 

CS = S; 

while (een > 0 && (c = getc(iop)) != EOF) if ((*cs++ = c) == ‘\n’) 
break; 

*cs = '\0'; 

return (c == EOF && cs == s) ? NULL: s; 


} 


/* fputs: put string s on file iop */ int fputs(char *s, FILE *iop) 
{ 

int c; 

while (c = *s++) putc(c, iop); 

return ferror(iop) ? EOF : 0; 

} 


ANSI 标准 规定 ，ferror 在 发 生 错误 时 返回 非 0 值 ， 而 fputs 在 发 生 错 
误 时 返回 EOF, 其它 情况 返回 一 个 非 负 值 。 


使 用 fgets 函数 很 容易 实现 getline 函数 : 


/* getline: read a line, return length */ int getline(char “line, int 
max) 


{ 

if (fgets(line, max, stdin) == NULL) return 0; 
else 

return strlen(line); 

} 


FTS 。。 编写 一 个 程序 ， 比 较 两 个 文件 并 打印 它们 第 一 个 不 
司 的 行 。 


练习 77 修改 第 5 章 的 模式 得 找 程序 ， 使 它 从 一 个 命名 文件 的 集合 

读 取 输入 (有 文 件 名 参数 时 )， 如 果 没 有 文件 名 参数 ， 则 从 标准 输入 中 

， 。 当 发 现 一 个 匹配 行 时 ， 有 是 否 应 该 将 相应 的 文件 名 打印 出 
? 


练习 798 编写 一 个 程序 ， 以 打印 一 个 文件 集合 ， 每 个 文件 从 新 的 一 页 
开始 打印 ， 并 且 打印 每 个 文件 相应 的 标题 和 页 数 。 


7.8 HERZ 

VEETEE TREBEA HN BARE o AEE HE BIA E 
ISAND o EPEA A AS DSIRE HF ef A N 
Tk Be 


7.8.1. FFF R ERIE KEN 


头 文 件 


<string.h> 中 定义 。 在 下 面 的 各 个 函数 中 ，s 与 t 为 char* 类 型 ，c 与 n 
为 int 类 型 。 


meo 将 + 指向 的 字符 串 连 接 到 s 指向 的 字符 串 的 末尾 


macon ”将 t 指 向 的 字符 串 中 前 n 个 字符 连接 到 s 指向 的 字符 串 的 
末尾 


“own 根据 s 指向 的 字符 串 小 于 (s<D、 等 于 (s==t) 或 大 于 (s>0 
指向 的 字符 串 的 不 同情 况 ， 分 别 返 回 负 整数 、0 或 正 整 数 
semis) R] stremp 相同 ， 但 只 在 前 n 个 字符 中 比较 

weno 将 t 指 向 的 字符 串 复制 到 s 指向 的 位 置 


moen ”将 t 指 向 的 字符 串 中 前 n 个 字符 复制 到 s 指向 的 位 置 


moo ”返回 s 指向 的 字 答 串 的 长 度 


wwo 在 s 指 向 的 字符 串 中 查找 c， 若 找到 ， 则 返回 指向 它 第 一 次 
出 现 的 位 


置 的 指针 ， 否 则 返回 NULL 


memo) 在 s 指 向 的 字符 串 中 查找 c， 大 找到 ， 则 返回 指 癌 它 最 
次 出 现 的 


位 置 的 指针 ， 否 则 返回 NULL 

7.8.2. 字符 类 别 测试 和 转换 函数 

头 文 件 <ctype.h> 中 定义 了 一 些 用 于 字符 测试 和 转换 的 函数 。 在 下 面 各 
个 函数 中 ，c 是 一 个 可 表示 为 unsigned char 类 型 或 EOF 的 int 对 象 。 
该 函数 的 返回 值 类 型 为 int 。 

mowo 若 c 是 字母， 则 返回 一 个 非 0 值 ， 否 则 返回 0 wr“。% Æc 
是 大 写字 母 ， 则 返回 一 个 非 0 值 ， 否 则 返回 0w“® 若 c 是 小 写字 
母 ， 则 返回 一 个 非 0 值 ， 否 则 返回 0 wx% ”车 c 是 数字 ， 则 返回 一 
个 韭 0 值 ， 否 则 返回 0 

mn ” 阁 isalpha(c) 或 isdigit(c)， 则 返回 一 个 非 0 值 ， 否 则 返回 0 


woe Fe CARN + BULA KOR BEG, BIERI 
制 表 符 ， 


则 返回 一 个 非 0 值 
toup p er( c ) i [E] C 的 大 写 形式 
wwo ”返回 c 的 小 写 形式 


T 


7.8.3. ungetc 函数 


标准 库 提 供 了 一 个 称 为 ungetc WERE, ER 4 章 中 编写 的 函数 
ungetch 相 比 功能 更 受 限 制 。 


int ungetc(int c, FILE *fp) 

RBCS c 写 回 到 文件 fp 中 。 如 末 执 行 成 功 ， 则 返回 c， 否 则 返 

回 EOF。 每 个 文件 只 能 接收 一 个 写 回 字符 。ungetc 函数 可 以 和 任何 一 
个 输入 函数 一 起 使 用 ， 比 如 scanf ` gete 或 getchar ° 

7.8.4. AS PUT NK 

函数 system(char* S) 执 行 包含 在 字符 申 s 中 的 命令 ， 然 后 继续 执行 当前 


程序 。s 的 内 容 在 很 大 程度 上 与 所 用 的 操作 系统 有 天。 下面 来 看 一 个 
UNIX 操作 系统 环境 的 小 例子 。 语 名 


system("date"); 

将 执行 程序 date， 它 在 标准 输出 上 打印 当天 的 日 期 和 时 间 。system EK 
数 返 回 一 个 整 型 的 状 态 值 ， 其 值 来 目 于 执行 的 命令 ， 并 同 具 体系 统 
K ° Æ UNIX 系统 中 ， 返 回 的 状态 是 exit 的 返回 值 。 

7.8.5. 存储 管理 函数 


函数 malloc 和 calloc 用 于 动态 地 分 配 存 储 块 。 函 数 malloc 的 声明 如 
F: 


void *malloc(size_t n) 


当 分 配 成 功 时 ， 它 返回 一 个 指针 ， 设 指针 指向 n 字 节 长 度 的 未 初始 化 
的 存储 空间 ， 否 则 返回 


NULL ° RX calloc 的 声明 为 


void *calloc(size_t n, size_t size) 


当 分 配 成 功 时 ， 它 返回 一 个 指针 ， 该 指针 指向 的 空闲 空间 足以 容纳 由 
成 的 数组 ， 否 则 返回 NULL。 该 存储 空间 被 初 
ALA 0 ° 


根据 请 求 的 对 象 类 型 ，malloc 或 calloc 函数 返回 的 指针 满足 正确 的 对 
齐 要 求 。 下 面 的 例子 进行 了 类 型 转换 : 


int *ip; 

ip = (int *) calloc(n, sizeof(int)); 

free(p) HACE p FERIA ATA IA], EL, p 是 此 前 通过 调用 malloc 
7 calloc K 数 得 到 的 指针 。 存 储 空间 的 释放 顺序 没有 什么 限制 ， 但 


如 果 释 放 一 个 不 是 通过 调用 malloc 或 calloc 函数 得 到 的 指针 所 指 
向 的 存储 空 x 间 ， 将 是 一 个 很 严重 的 错误 。 


使 用 已 经 释放 的 存储 空间 同样 是 错误 的 。 下 面 所 示 的 代码 是 一 个 很 典 
型 的 错误 代码 段 ， 它 通过 一 个 循环 释放 列表 中 的 页 目 : 


for (p = head; p != NULL; p = p*>next) /* WRONG */ free(p); 


正确 的 处 理 方法 是 ， 在 释放 页 目 之 前 先 将 一 切 必要 的 信息 保存 起 来 ， 
如 下 所 示 : 


for (p = head; p != NULL; p = q) { q = p*>next; 
free(p); 
} 


8.7 TAE S—TIMAF malloc 函数 的 存储 分 配 程序 的 实现 。 该 存储 
分 配 程序 分 配 的 存 储 块 可 以 以 任意 顺序 释放 。 


7.8.6. 数学 函数 

头 文件 <math.h> 中 声明 了 20 多 个 数学 画 数 。 下 面 介绍 一 些 常 用 的 数学 
函数 ， 每 个 函数 和 带 有 一 个 或 两 个 double 类 型 的 参数 ， 并 返回 一 个 
double 类 型 的 值 。 

“0 x 的 正弦 琅 数 ， 其 中 x 用 弧度 表示 


etx) x FSR SX ENA, ELH x HIVER oo yx KBE 
数 ， 其 中 ,，Xx 和 yy 用 弧度 表示 FRR e* 


“x 的 自然 对 数 (以 e 为 底 )， 其 中 ，x>0 
wom x 的 常用 对 数 (以 10 为 底 )， 其 中 ，x>0 
mo BE YEE 

oo) x 的 平方 根 ( 泣 0) 

me x 的 绝对 什 

7.8.7. 随机 数 发 生 器 画 数 


函数 rand0 生 成 介 于 0 FI RAND MAX 之 间 的 伪 随 机 整数 序列 。 其 中 
RAND MAX 是 在 头 文件 <stdlib.h> 中 定义 的 符号 常量 。 下 面 是 一 种 生 
成 大 于 等 于 0 但 小 于 1 的 随机 浮 点 数 的 方法 : 

#define frand() ((double) rand() / (RAND MAX+1.0)) 


(QU RPT AA ea ee Pape TE BE LEE, BLA 
可 能 比 上 面 这 个 函数 具有 更 好 的 统计 学 特性 。) 


函数 srand(unsigned) 设 置 rand 函数 的 种 子 数 。 我 们 在 2.7 节 中 给 出 了 
遵循 标准 的 


rand 和 srand 函数 的 可 移植 的 实现 。 


练习 7。9 类 似 于 isupper 这 样 的 函数 可 以 通过 某 种 方式 实现 以 达到 和 省 
空间 或 时 间 的 目的 。 考 虑 节省 空间 或 时 间 的 实现 方式 。 


第 8 章 UNIX 系统 接口 


UNIX 操作 系统 通过 一 系列 的 系统 调用 提供 服务 ， 这 些 系统 调用 实际 
上 是 操作 系统 内 的 函数 ， 它 们 可 以 被 用 户 程序 调用 。 本 章 将 介绍 如 何 
在 C 语言 程序 中 使 用 一 些 重要 的 系统 调用 。 如 果 读 者 使 用 的 是 
UNIX， 本 章 将 会 对 你 有 直接 的 帮助 ， 这 是 因为 ， 我 们 经 常 需要 借助 于 
系统 调用 以 获得 最 高 的 效率 ， 或 者 访问 标准 库 中 没有 的 某 些 功 能 。 但 
是 ， 即 使 读者 是 在 其 它 操作 系统 上 使 用 C 语言 ， 本 章 的 例子 也 将 会 帮 
助 你 对 C 语言 程序 设计 有 更 深入 的 了 解 。 不 同系 统 中 的 代码 具有 相似 
性 ， 只 是 一 些 细 节 上 有 区 别 而 已 。 因 为 ANSI C 标准 函数 库 是 以 UNIX 
系统 为 基础 建立 起 来 的 ， 所 以 ， 学 习 本 章 中 的 程序 还 将 有 助 于 更 好 地 
理解 标准 库 。 


本 章 的 内 容 包括 3 个 主要 部 分 ， 输 入 /和 输出、 文件 系统 和 存储 分 配 。 其 
中 ， 前 两 部 分 的 内 容 要 求 读 者 对 UNIX 系统 的 外 部 特性 有 一 定 的 了 


解 


第 7 草 介 绍 的 输入 /输出 接口 对 任何 操作 系统 都 是 一 样 的 。 在 任何 特定 
的 系统 中 ， 标 准 库 函 数 的 实现 必须 通过 答 主 系统 提供 的 功能 来 实现 。 
fe ORAL TITER UNIX 系统 中 用 于 输入 和 输出 的 系统 调用 ， 并 介 
绍 如 何 通过 它们 实现 标准 库 。 


8.1 文件 描述 符 


在 UNIX 操作 系统 中 ， 所 有 的 外 围 设 备 (包括 键盘 和 显示 融 ) 都 被 看 作 
征文 件 系统 中 的 文件， 因此， 所 有 的 输入 /输出 都 要 通过 读 文件 或 写 文 
件 完成 。 也 束 是 说 ， 通 过 一 个 单一 的 接口 吏 可 以 处 理 外 围 设备 和 程序 
之 间 的 所 有 通信 。 


通常 情况 下 ， 在 读 或 写 文件 之 前 ， 必 须 允 将 这 个 意图 通知 系统 ， 该 过 
程 称 为 打开 文件 。 如 有 果 是 写 一 个 文件 ， 则 可 能 需要 先 创建 该 文件 ， 也 
可 能 需要 丢弃 该 文件 中 原先 已 存在 的 内 容 。 系统 检查 你 的 权力 (该 文 
件 是 否 存 在 ?是 否 有 访问 它 的 权限 ?)， 如 果 一 切 正常 ， 操 作 采 统 将 向 程 
序 返 回 一 个 小 的 非 负 整数 ， 该 整数 称 为 文件 朱 述 符 。 任 何 时 候 对 文件 
的 输入 /和 输出 都 是 通过 文件 摘 述 符 标 识 文 件 ， 而 不 征 通过 文件 名 标识 文 
件 。( 文 件 描述 符 类 似 于 标准 库 中 的 文件 指针 或 MS*DOS 中 的 文件 名 


柄 。) 系 统 负 责 维护 已 打开 文件 的 所 有 信息 ， 用 户 程 序 只 能 通过 文 件 
描述 符 引 用 文件 ， 


因为 大 多 数 的 输入 /输出 是 通过 键盘 和 显示 右 来 实现 的 ， 为 了 方便 起 
见 ，UNIX 对 此 做 了 特别 的 安排 。 当 命令 解释 程序 (BR“ shell") 运 行 一 
个 程序 的 时 候 ， 它 将 打开 3 个 文件 ， 对 应 的 文件 描述 符 分 别 为 0，1， 
2， 依 次 表示 标准 输入 ， 标 准 输出 和 标准 错误 。 如 果 程序 从 文件 0 


中 读 ， 对 1 和 2 进行 写 ， 就 可 以 进行 输 / 输 出 而 个 必 关 心 打 开 文件 的 问 


题 。 
程序 的 使 用 者 可 通过 < 和 > 重 定 同 程序 的 TO: 
prog < 输入 文件 名 > 输出 文件 名 


这 种 情况 下 ，shell 把 文件 描述 符 0 和 1 的 默认 赋值 改变 为 指定 的 文 

件 。 通 常 ， 文 件 摘 述 符 2 仍 与 显示 絮 相 关联 ， 这 样 ， 出 错 信息 会 输出 
到 显示 右上 。 与 管道 相关 的 输入 /输出 也 有 类 似 的 特性 。 在 任何 情况 
下 ， 文 件 赋 值 的 改变 都 不 是 由 程序 完成 的 ， 而 是 由 shell 完成 的 。 只 

FE 序 使 用 文件 0 作为 输入 ,文件 1 和 2 作为 输出 ， 它 就 不 会 知道 程序 
的 输入 从 哪里 来 ， 并 输出 


到 哪里 去 。 
8.2 低级 VO read 和 write 


输入 与 输出 是 通过 read 和 write 系统 调用 实现 的 。 在 C 语言 程序 中 ， 
可 以 通过 函数 read 和 write 访问 这 两 个 系统 调用 。 这 两 个 函数 中 ， 第 
一 个 参数 是 文件 描述 符 ， 第 二 个 参数 是 程序 中 存放 读 或 写 的 数据 的 字 
符 数 组 ， 第 三 个 参数 是 要 传输 的 字 和 数 。 


int n_read = read(int fd, char *buf, int n); 
int n_written = write(int fd, char *buf, int n); 


每 个 调用 返回 实际 传输 的 字 世 数 。 在 读 文 件 时 ， 男 数 的 返回 值 可 能 会 
小 于 请 求 的 字 市 数 。 如 果 返 回 值 为 0， 则 表示 已 到 达 文 件 的 结尾 ;如 有 果 
返回 值 为 1， 则 表示 发 生 了 某 种 错误 。 在 写 文 件 时 ， 返 回 值 是 实际 写 
入 的 字 世 数 。 如 采 返 回 值 与 请 求 写 入 的 字 世 数 不 相 等 ， 则 说 明 发 生 了 


DE 


FE—UR Wal, EE ARAE TCA AERAR o e H 
的 值 为 1， 即 每 次 读 EREA 工 个 字符 (无 缓冲 )， 或 是 类 似 于 
10244096 这 样 的 与 外 围 设备 的 物理 块 大 小 相应 的 值 。 用 更 大 的 值 调 
用 该 贸 数 可 以 获得 更 高 的 效率 ， 因 为 系统 调用 的 次 数 减 少 了 。 
结合 以 上 的 讨论 ， 我 们 可 以 编写 一 个 人 简单 的 程序 ， 将 输入 复制 到 输 


出 ， 这 与 第 1 章 中 的 复制 程序 在 功能 上 相同 。 程 序 可 以 将 任意 输入 复 
制 到 任意 输出 ， 因 为 输入 /输出 可 以 重 定 癌 到 任何 文件 或 设备 。 


#include "syscalls.h" 

main() /* copy input to output */ 
{ 

char buf[BUFSIZ]; int n; 


while ((n = read(0, buf, BUFSIZ)) > 0) write(1, buf, n); 


return 0; 


} 


我 们 已 经 将 系统 调用 的 函数 原型 集中 放 在 一 个 头 文件 syscalls.h 中 ， 
本 章 中 的 程序 都 将 包含 该 头 文件 。 不 过 ， 该 文件 的 名 字 不 是 标准 


参数 BUFSIZ 也 已 经 在 syscalls.h 头 文件 中 定义 。 对 于 所 使 用 的 操作 系 
统 来 说 ， 该 值 是 一 个 较 合 适 的 数值 。 如 果 文 件 大 小 不 是 BUFSIZ 的 倍 
数 ， 则 对 read 的 某 次 调用 会 返回 一 个 较 小 的 字 节 数 ，wtrite 再 按 这 个 
SPAMS, Ua read 将 返回 0。 


为 了 更 好 地 掌握 有 关 概 念 ， 下 面 来 说 明 如 何 用 read 和 write 构造 类 似 
于 getchar ` putchar 等 的 高 级 函数 。 例 如 ， 以 下 是 getchar 函数 的 一 个 
版 本 ， 它 通过 每 次 从 标准 输入 读 入 一 个 字符 来 实现 无 缓冲 输入 。 


#include "syscalls.h" 


/* getchar: unbuffered single character input */ int getchar(void) 


{ 


char c; 

return (read(0, &c, 1) == 1) ? (unsigned char) c : EOF; 

} 

其 中 ，c 必须 是 一 个 char 类 型 的 变量 ， 因 为 read 函数 需要 一 个 字符 指 
针 类 型 的 参数 (&c)。 在 返回 语句 中 将 c 转换 为 unsigned char 类 型 可 以 
消除 符号 扩展 问题 。 

getchar 的 第 二 个 版 本 一 次 读 入 一 组 字符 ， 但 每 次 只 输出 一 个 字符 。 
#include "syscalls.h" 

/* getchar: simple buffered version */ int getchar(void) 

{ 


static char buf[BUFSIZ]; static char *bufp = buf; static int n = 0; 


if (n == 0) { /* buffer is empty */ n = read(0, buf, sizeof buf); bufp 
= buf; 


} 
return (een >= 0) ? (unsigned char) *bufp++ : EOF; 
} 


如 果 要 在 包含 头 文件 <stdio.h> 的 情况 下 编译 这 些 版 本 的 getchar 函数 ， 
MALEH 


#undef 预 处 理 指 令 取消 名 字 getchar 的 宏 定义 ， 因 为 在 头 文 件 中 ， 
getchar 是 以 宏 方 式 


实现 的 。 


8.3 open ` creat ` close 和 unlink 


除了 默认 的 标准 输入 、 标 准 输出 和 标准 错误 文件 外 ， 其 它 文 件 都 必须 
在 读 或 写 之 前 显 式 地 打开 。 系 统 调用 open 和 creat 用 于 实现 该 功能 。 
open 与 第 7 草 讨论 的 fopen 相似 ， 不 同 的 是 ， 前 者 返回 一 个 文件 描述 
符 ， 它 仅仅 只 是 一 个 int 类 型 的 数值 。 而 后 者 返回 一 个 文件 指针 。 如 
果 发 生 错 误 ，open 将 返回 .1。 


#include <fcntl.h> 


int fd; 
int open(char *name, int flags, int perms); fd = open(name, flags, perms); 


与 fopen 一 样 ， 参 数 name 是 一 个 包含 文件 名 的 字符 串 。 第 二 个 参数 
flags 是 一 个 int 类 


型 的 值 ， 它 说 明 以 何 种 方式 打开 文件 ， 主 要 的 几 个 值 如 下 所 示 : 


O_RDONLY 以 只 读 方 式 打 开 文 件 O_WRONLY 以 只 写 方式 打开 文件 
O_RDWR 以 读 写 方式 打开 文件 


在 System V UNIX 系统 中 ， 这 些 常量 在 头 文件 <fcntLh> 中 定义 ， 而 在 
Berkeley(BSD) 版 本 中 则 在 <sys/file.h> 中 定义 。 


可 以 使 用 下 列 语句 打开 一 个 文件 以 执行 读 操作 : 
fd = open(name, O_RDONLY,0); 
在 本 章 的 讨论 中 ，open 的 参数 perms 的 值 始终 为 0。 


如 条 用 open 打开 一 个 不 存在 的 文件 ， 则 将 导致 错误 。 可 以 使 用 creat 
系统 调用 创建 新 文件 或 覆 关 已 有 的 旧 文 件 ， 如 下 所 示 : 


int creat(char *name, int perms); fd = creat(name, perms); 


QAR creat 成 功 地 创建 了 文件 ， 它 将 返回 一 个 文件 描述 答 ， 否 则 返回 
1° 如 果 此 文件 已 存在 ， creat 将 把 该 文件 的 长 度 截断 为 0， 从 而 丢弃 
原先 已 有 的 内 容 。 使 用 creat 创建 一 个 已 存在 的 文件 不 会 导致 错误 。 


如 果 要 创建 的 文件 不 存在 ， 则 creat 用 参数 perms 指定 的 权限 创建 文 
件 。 在 UNIX 文件 系统 中 ， 每 个 文件 对 应 一 个 9 比特 的 权限 信息 ， 它 
们 分 别 控制 文件 的 所 有 者 、 所 有 者 组 和 


其 他 成 员 对 文件 的 读 、 写 和 执行 访问 。 因 此 ， 通 过 一 个 3 位 的 八进制 
数 束 可 方便 地 说 明 不 同 的 权限 ， 例 如 ，0755 说 明文 件 的 所 有 者 可 以 对 
i aac ace 
pies ° 

下 面 通过 一 个 简化 的 UNIX 程序 cp 说 明 creat 的 用 法 。 该 程序 将 一 个 
文件 复制 到 另 一 个 文件 。 我 们 编写 的 这 个 版 本 仅仅 只 能 复制 一 个 文 

件 ， 不 允许 用 目录 作为 第 二 个 参数 ， 并 且 ， 目标 文件 的 权限 不 是 通过 
复制 获得 的 ， 而 是 重新 定义 的 。 


#include <stdio.h> 


#include <fcntl.h> 
#include "syscalls.h" 


#define PERMS 0666 /* RW for owner, group, others */ 
void error(char *, i); 


/* cp: copy f1 to f2 */ main(int argc, char *argv[]) 
{ 

int f1, f2, n; char buf[ BUFSIZ]; 

if (argc != 3) 

error(""Usage: cp from to"); 


if ((f1 = open(argv[1], O_RDONLY, 0)) == 1) error("cp: can't open %s", 
argv[1]); 


if ((f2 = creat(argv[2], PERMS)) == ¢1) error("cp: can't create %s, mode 
%030", 


argv[2], PERMS); 

while ((n = read(f1, buf, BUFSIZ)) > 0) if (write(f2, buf, n) != n) 
error("cp: write error on file %s", argv[2]); return 0; 

} 

该 程序 创建 的 输出 文件 具有 固定 的 权限 0666。 利 用 8.6 市 中 将 要 讨论 
可 以 获得 一 个 已 存在 文件 的 模式 ， 并 将 此 模式 赋值 


ER, RR error 类 似 于 函数 printf， 在 调用 时 可 带 变 长 参数 表 。 下 面 
通过 error EX 


数 的 实现 说 明 如 何 使 用 printf 函数 家 族 的 另 一 个 成 员 vprintf i 标准 库 
函数 vprintf 数 与 printf 函数 类 似 ， 所 不 同 的 是 ， 它 用 一 个 参数 取代 了 
变 长 参数 表 ， 且 此 参数 通过 调用 va_start 宏 进 行 初 始 化 。 同 样 ， 
vfprintf 和 vsprintf 函数 分 别 与 fprintf 和 sprintf 函数 类 似 。 

#include <stdio.h> 

#include <stdarg.h> 


/* error: print an error message and die */ void error(char *fmt, ...) 


{ 
va_list args; 


va_start(args, fmt); fprintf(stderr, "error: "); vprintf(stderr, fmt, args); 
fprintf(stderr, "\n"); va_end(args); 


exit(1); 
} 


一 个 程序 同时 打开 的 文件 数 是 有 限制 的 (通常 为 20)。 相 应 地 ， 如 果 一 
个 程序 需要 同时 处 BRA CEE, BRA EY i Be A cP AF o ER BY 
close(int fd) 用 来 断 开 文件 描述 符 和 已 打开 文件 之 间 的 连接 ， 并 释放 此 
文件 描述 符 ， 以 供 其 它 文 件 使 用 。close 函数 与 标准 库 中 的 fclose 函数 
相对 应 ， 但 它 不 需要 清洗 (flush) 绥 冲 区 。 如 果 程 序 通 过 exit 函数 退出 
或 从 主 程序 中 返回 ， 所 有 打开 的 文件 将 被 关闭 。 


函数 unlink(char *name) 将 文件 name 从 文件 系统 中 删除 ， 它 对 应 于 标 
准 库 函数 


remove ° 


练习 Bel FA read ` write ` open 和 close 系统 调用 代替 标准 库 中 
功能 等 价 的 函数 ， 重 写 第 7 章 的 cat 程序 ， 并 通过 实验 比较 两 个 版 本 
的 相对 执行 速度 。 


8.4 随机 访问 


输入 /输出 通常 是 顺序 进行 的 :每 次 调用 read 和 write 进行 读 写 的 位 置 紧 
跟 在 前 一 次 操作 的 位 置 之 后 。 但 是 ， 有 时 候 需 要 以 任意 顺序 访问 文 
系统 调用 lseek 可 以 在 文件 中 任 意 移动 位 置 而 不 实际 读 写 任何 数 


long lseek(int fd, long offset, int origin); 


将 文件 描述 符 为 fd 的 文件 的 当前 位 置 设置 为 offset， 其 中 ，offset 是 相 

对 于 orgin 指定 的 位 置 而 言 的 。 随 后 进行 的 读 写 操作 将 从 此 位 置 开 

始 ，origin 的 值 可 以 为 0、1 或 2， 分 别 用 于 指定 offset 从 文件 开始 、 

从 当前 位 置 或 从 文件 结束 处 开始 算 起 。 例 如 ， 为 了 同一 个 文 BS 

添加 内 容 ( 在 UNIX shell 程序 中 使 用 重 定向 符 >> 或 在 系统 调用 fopen 中 

oe “ am， 则 在 写 操作 之 前 必须 使 用 下 列 系 统 调用 找到 文件 的 
Æ: 


lseek 


Iseek(fd, OL, 2); 
若 要 返回 文件 的 开始 处 ( 即 反 绕 )， 则 可 以 使 用 下 列 调用 : 
Iseek(fd, OL, 0); 


请 注意 ， 参 数 0L 也 可 写 为 ong)0， 或 仅仅 写 为 0， 但 是 系统 调用 
lseek 的 声明 必须 保持 一 致 。 


使 用 lseek 系统 调用 时 ， 可 以 将 文件 视 为 一 个 大 数组 ， 其 代价 是 访问 
速度 会 慢 一 些 。 例 如 ， 下 面 的 钞 数 将 从 文件 的 任意 位 置 读 入 任意 数目 
的 字 闻 ， 它 返回 读 入 的 字 节 数 ， 大 发 生 错 误 ， 则 返回 "1。 


#include "syscalls.h" 


/*get: read n bytes from position pos */ int get(int fd, long pos, char 
*buf, int n) 


{ 

if (lseek(fd, pos, 0) >= 0) /* get to pos */ return read(fd, buf, n); 

else 

return °1; 

} 

lseek 系统 调用 返回 一 个 long RAE, UO, A 
发 生 错误 ， 则 返回 "1。 标准 库 函 数 fseek 与 系统 调用 lseek 类 似 ， 所 不 


le 前 者 的 第 一 个 参数 是 FILE * 类 型 ， 且 在 发 生 错误 时 返回 一 个 
0 o 


8.5 实例 一 一 fopen 和 getc 函数 的 实现 


下 面 以 标准 库 函 数 fopen 和 gete 的 一 种 实现 方法 为 例 来 说 明 如 何 将 这 
些 系 统 调 用 结合 起 来 使 用 。 


我 们 回忆 一 下 ， 标 准 库 中 的 文件 不 是 通过 文件 摘 述 符 摘 述 的 ， 而 是 使 
用 文件 指针 摘 述 的 。 文件 指针 是 一 个 指 回 包含 文件 各 种 信息 的 结构 的 
指针 ， 该 结构 包含 下 列 内 容 :一 个 指 回 缓冲 区 的 指针 ， 通 过 它 可 以 一 次 
读 入 文件 的 一 大 块 内 容 ;一 个 记录 缓冲 区 中 剩余 的 字符 数 的 计数 器 ;一 


个 指 回 缓冲 区 中 下 一 个 字符 的 指针 ;文件 描述 符 ; 描 述 读 / 写 模式 的 标志 ; 
描述 错误 状态 的 标志 等 。 


描述 文件 的 数据 结构 包 售 在 头 文件 <stdio.h> 中 ， 任 何 需 要 使 用 标准 输 
NI EE FFE PER 数 的 程序 都 必须 在 源 文件 中 包 侣 这 个 头 文件 (通过 
#include 指令 包含 头 文件 )。 此 文件 也 被 ERRE KRES o E 
这 段 典 型 的 <stdio.h> 代 码 段 中 ， 只 供 标 准 库 中 其 它 函 数 所 使 用 的 名 字 
以 下 划 线 开始 ， 因 此 一 般 不 会 与 用 户 程 序 中 的 名 字 冲 突 。 所 有 的 标准 
FE EK SERS IE 该 约定 。 


#define NULL 0 

#define EOF (°1) 

#define BUFSIZ 1024 

#define OPEN_MAX 20 /* max #files open at once */ 


typedef struct _iobuf { 
int cnt; /* characters left */ 


char *ptr; /* next character position */ char *base; /* 
location of buffer */ 


int flag; /* mode of file access */ int fd; /* 
file descriptor */ 


} FILE; 


extern FILE iob[OPEN MAX]; 


#define stdin (&_iob[0]) 
#define stdout (&_iob[1]) 
#define stderr (&_iob[2]) 


enum _ flags { 


_READ = 01, /* file open for reading */ 
_WRITE = 02, /* file open for writing */ 
_UNBUF = 04, /* file is unbuffered */ 

_EOF = 010, /* EOF has occurred on this file */ 
_ERR = 020 /* error occurred on this file */ 

}; 


int _fillbuf(FILE *); 


int _flushbuf(int, FILE *); 


#define feof(p) ((p)*>flag & _EOF) != 0) 
#define ferror(p) ((p)*>flag & _ERR) != 0) 
#define fileno(p) ((p)*>fd) 

#define getc(p) (**(p)*>cnt >= 0 \ 


? (unsigned char) *(p)*>ptr++ : _fillbuf(p)) 
#define putc(x,p) (**(p)*>cnt >= 0 \ 
? *(p)e>ptr++ = (x) : _flushbuf((x),p)) 


#define getchar() getc(stdin) 


#define putcher(x) putc((x), stdout) 


安 getc 一 般 先 将 计数 器 减 1， 将 指针 移 到 下 一 个 位 置 ， 然 后 返回 字 
符 。( 前 面 讲 过 ， 一 个 长 的 #define 语句 可 用 反 斜 杠 分 成 几 行 。) 但 是 ， 
如 果 计 数值 变 为 负 值 ，getc Piva K 


_fillbuf 填充 缓冲 区 ， 重 新 初始 化 结构 的 内 容 ， 并 返回 一 个 字符 。 返 回 
的 字符 为 unsigned 

类 型 。 以 确保 所 有 的 字符 为 正 值 。 

尽管 在 这 里 我 们 并 不 想 讨 论 一些 细 节 ， 但 程序 中 还 是 给 出 了 pute 函数 
的 定义 ， 以 表明 它 的 操作 与 getc 函数 非常 类 似 ， 当 缓冲 区 满 时 ， 它 将 
调用 函数 _flushbuf。 此 外 ， 我 们 还 在 其 中 包含 了 访问 错误 输出 、 文 件 
结束 状态 和 文件 摘 述 符 的 宏 。 

下 面 我 们 来 着 手 编写 函数 fopen。fopen 函数 的 主要 功能 是 打开 文件 ， 
定位 到 合适 的 位 置 ， 设 置 标志 位 以 指示 相应 的 状态 。 它 不 分 配 任何 组 
冲 区 空间 ， 缓 冲 区 的 分 配 是 在 第 一 次 读 文件 时 由 函数 _fillbuf 完成 的 。 


#include <fcntl.h> 


#include "syscalls.h" 

#define PERMS 0666 /* RW for owner, group, others */ 
FILE *fopen(char *name, char *mode) 

{ 

int fd; FILE *fp; 

if (*mode != 'r' && *mode != 'w' && *mode != 'a') return NULL; 


for (fp = _iob; fp < __iob + OPEN_MAX; fp++) if ((fpe>flag & (_READ | 
_WRITE)) == 0) 


break; /* found free slot */ 


if (fp >= _iob + OPEN_MAX) /* no free slots */ 


return NULL; 

if (*mode == 'w') 

fd = creat(name, PERMS); else if (*mode == 'a’) { 

if ((fd = open(name, O_WRONLY, 0)) == "1) fd = creat(name, PERMS); 
Iseek(fd, OL, 2); 

} else 

fd = open(name, O_RDONLY, 0); 

if (fd == «1) /* couldn't access name */ return NULL; 

fp*>fd = fd; fps>cnt = 0; fp*>base = NULL; 

fp*>flag = (*mode == 'r') ? _READ : _WRITE; return fp; 

} 

该 版 本 的 fopen KAA Re C 的 所 有 访问 模式 ， 但 是 ， 加 入 这 
些 模式 并 不 需要 增加 多 少 代码 。 特 别 是 ， 该 版 本 的 fopen 不 能 识别 表 
示 二 进 制 访问 方式 的 b 标志， 这 是 因为 ， 在 UNIX 系统 中 这 种 方式 是 
没有 意义 的 。 同 时 ， 它 也 不 能 识别 允许 同时 进行 读 和 写 的 + 标志 。 


对 于 某 一 特定 的 文件 ， 第 一 次 调用 gete 函数 时 计数 值 为 0， 这 样 束 必 
须 调用 一 次 函数 


_fillbuf。 如 果 _fillbuf 发 现 文件 不 是 以 读 方式 打开 的 ， 它 将 立即 返回 
EOF; 否 则 ， 它 将 


试图 分 配 一 个 缓冲 区 (如 果 读 操作 是 以 缓冲 方式 进行 的 话 )。 
建立 缓冲 区 后 ，_filbuf 调用 read 填充 此 缓冲 区 ， 设 置 计 数值 和 指针 ， 


并 返回 缓冲 区 中 的 第 一 个 字符 。 随 后 进行 的 _fillbuf 调用 会 发 现 缓冲 区 
已 经 分 配 。 


#include "syscalls.h" 


/* _fillbuf: allocate and fill input buffer */ int _fillbuf(FILE *fp) 


{ 
int bufsize; 
if ((fp*>flag&(_READ|_EOF_ERR)) != _READ) return EOF; 


bufsize = (fp*>flag & _UNBUF) ? 1 : BUFSIZ; if (fp*>base == 
NULL) /* no buffer yet */ 


if ((fp*>base = (char *) malloc(bufsize)) == NULL) return EOF; 
can't get buffer */ 


fp*>ptr = fp*>base; 

fp*>cnt = read(fp*>fd, fp*>ptr, bufsize); 让 (fp*>cnt < 0) { 
if (fp°>cnt == °1) fp*>flag |= _EOF; 

else 

fp*>flag |= _ERR; fp*>cnt = 0; 

return EOF; 

} 

return (unsigned char) *fp*>ptr++; 


} 


Boe PS Te 1 ce a RT I EE Bo BOA 2 EA a RA 


_iob 中 的 stdin ` 


/* 


stdout 和 stderr 值 : 

FILE iob[OPEN MAX] = { /* stdin, stdout, stderr */ 
{ 0, (char *) 0, (char *) 0, READ, 0 }, 

{ 0, (char *) 0, (char *) 0, WRITE, 1 }, 

{ 0, (char *) 0, (char *) 0, WRITE, | UNBUF, 2 } 

}; 


该 结构 中 flag 部 分 的 初 值 表明 ， 将 对 stdin 执行 读 操作 、 对 stdout 执行 
写 操 作 、 对 stderr 


执行 缓冲 方式 的 写 操作 。 


练习 8.2 用 字段 代替 显 式 的 按 位 操作 ， 重 写 fopen 和 _fillbuf 函数 。 比 
较 相 应 代 码 的 长 度 和 执行 速度 。 


练习 8。3 设计 并 编写 函数 flushbuf ` fflush 和 fclose。 练习 
8.4 标准 库 函 数 


int fseek(FILE *fp, long offset, int origin) 


类 似 于 函数 lseek， 所 不 同 的 是 ， 该 函数 中 的 印 是 一 个 文件 指针 而 不 
是 文件 描述 符 ， 且 返回 值 是 一 个 int 类 型 的 状态 而 非 位 置 值 。 编 写 画 
数 fseek, HERZ KAS ERR E KAEH 的 缓冲 能 够 协同 工作 。 


8.6 实例 一 一 目录 列表 


我 们 常常 还 需要 对 文件 系统 执行 男 一 种 操作 ， 以 获得 文件 的 有 关 信 
思 ， 而 不 是 读 取 文 件 的 具体 内 容 。 目 孙 列 表 程 序 便 是 其 中 的 一 个 例 
子 ， 比 如 UNIX 命令 ls， 它 打印 一 个 目录 中 的 文 件 名 以 及 其 它 一 些 可 
选 信 息 ， 如 文件 长 度 、 访 问 权 限 等 等 。MS*DOS 操作 系统 中 的 dir 命 
Sth 有 类 似 的 功能 。 


由 于 UNIX PAY Bei OCF, AE, Is Re BEL CP RE AT 7K 
得 所 有 的 文件 名 。 但 是 ， 如 采 需 要 获取 文件 的 其 它 信 息 ， 比 如 长 度 

等 ， 束 需要 使 用 系统 调用 。 在 其 它 一 些 系统 中 ， 甚至 获取 文件 名 也 需 
要 使 用 系统 调用 ， 例 如 在 MS-DOS 系统 中 即 如 此 。 无 论 实现 方式 是 否 
同 具体 的 系统 有 关 ， 我 们 需要 提供 一 种 与 系统 无 关 的 访问 文件 信息 的 


途径 。 


以 下 将 通过 程序 fsize 说 明 这 一 点 。fsize 程序 是 Is 命令 的 一 个 特殊 形 
式 ， 它 打印 命令 行 参数 表 中 指定 的 所 有 文件 的 长 度 。 如 果 其 中 一 个 文 
件 是 日 录 ， 则 fsize 程序 将 对 此 目 孙 递 归 调 用 自身。 如果 命令 行 中 没 
有 任何 参数 ， 则 fsize 程序 处 理 当 前 目 了 永 。 


我 们 首先 回顾 UNIX 文件 系统 的 结构 。 在 UNIX 系统 中 ， 目 隶 束 是 文 

件 ， 它 包含 了 一 个 文件 名 列表 和 一 些 指示 文件 位 置 的 信息 。" 位 置 "是 

一 个 指向 其 它 表 ( 即 i ARRIR] o 文件 的 i 结 总 是 存放 除 文件 名 以 
文件 信息 的 地 方 。 目 隶 页 通常 仅 包 含 两 个 条 有 目 : 文 件 名 和 i 结 
AIF ° 


遗憾 的 是 ， 在 不 同 版 本 的 系统 中 ， 目 录 的 格式 和 确切 的 内 容 是 不 一 样 
的 。 因 此 ， 为 了 分 离 出 不 可 移植 的 部 分 ， 我 们 把 任务 分 成 两 部 分 。 外 
层 定 义 了 一 个 称 为 Dirent 的 结构 和 3 个 函数 opendir ` readdir 和 
closedir， 它 们 提供 与 系统 无 关 的 对 目录 页 中 的 名 字 和 i 结 点 编号 的 访 
问 。 我 们 将 利用 此 接口 编写 fsize 程序 ， 然 后 说 明 如 何在 与 Version 7 
和 System V UNIX 系统 的 目录 结构 相同 的 系统 上 实现 这 些 钞 数 。 其 它 
情况 留 作 练习 。 


结构 Dirent 包含 i 结 点 编号 和 文件 名 。 文 件 名 的 最 大 长 度 由 
NAMZ_MAX 设 定 ，NAME_MAX 的 值 由 系统 决定 。opendir 返回 一 个 
指向 称 为 DIR 的 结构 的 指针 ， 该 结构 与 结构 FILE 类 似 ， 它 将 被 
readdir 和 closedir 使 用 。 所 有 这 些 信息 存放 在 头 文件 dirent.h 中 。 


#define NAME MAX 14 /* longest filename component; 
ay 


/* systemedependent */ 


typedef struct { /* portable directory entry */ long ino; 
/* inode number */ 


char name[NAME_ MAX+1]; /* name + '\O' terminator */ 
} Dirent; 
typedef struct { /* minimal DIR: no buffering, etc. */ int fd; 


/* file descriptor for the directory */ 
Dirent d; /* the directory entry */ 
} DIR; 


DIR *opendir(char *dirname); Dirent *readdir(DIR *dfd); void 
closedir(DIR *dfd); 


系统 调用 stat 以 文件 名 作为 参数 ， 返 回 文件 的 1 结 点 中 的 所 有 信息 ; 知 
出 错 ， 则 返回 .1。 如 下 所 示 : 


char *name; 
struct stat stbuf; 
int stat(char *, struct stat *); stat(name, &stbuf); 


它 用 文件 name 的 i 结 点 信息 填充 结构 stbuf。 头 文件 <sys/stath> 中 包含 
了 摘 述 stat 


的 返回 值 的 结构 。 该 结构 的 一 个 典型 形式 如 下 所 示 : 


struct stat /* inode information returned by stat */ 


warn 


' inode number 7 


该 结构 中 大 部 分 的 值 已 在 注 释 中 进行 了 解释 。 dev_t 和 inot 等 类 型 
Ee I 


<sys/types.h> 中 定义 ， 程序 中 必须 包含 此 文件 。 


st_mode 页 包含 了 描述 文件 的 一 系列 标志 ， 这 些 标志 在 <sys/stat.h> 中 害 
义 。 我 们 只 需要 处 理 文件 类 型 的 有 关 部 分 : 


#define S_IFMT 0160000 /* type of file: */ 
#define S_IFDIR 0040000 /* directory */ 


#define S_IFCHR 0020000 /* character special */ 


#define S_IFBLK 0060000 /* block special */ 

#define S_IFREG 0010000 /* regular */ 

Poy 

下 面 我 们 来 着 手 编写 程序 fsize 。 如 果 由 stat 调用 获得 的 模式 说 明 某 文 
件 不 是 一 个 目 录 ， 就 很 容易 获得 该 文件 的 长 度 ， 并 直接 输出 。 但 是 ， 
如 果 文 件 是 一 个 日 录 ， 则 必须 逐个 处 理 目 录 中 的 文件 。 由 于 该 日 录 可 
能 包含 子 日 录 ， 因 此 该 过 程 是 递归 的 。 

主 程 序 main 处 理 命令 行 参数 ， 并 将 每 个 参数 传递 给 函数 fsize。 


#include <stdio.h> 


#include <string.h> 


#include "syscalls.h" 


#include <fcntl.h> /* flags for read and write */ 
#include <sys/types.h> /* typedefs */ 
#include <sys/stat.h> /* structure returned by stat */ 


#include "dirent.h" void fsize(char *) 

/* print file name */ main(int argc, char **argv) 

{ 

if (argc == 1) /* default: current directory */ fsize(""."); 
else 

while (**argc > 0) fsize(*++argv); 


return 0; 


} 

ERY fsize 打印 文件 的 长 度 。 但 是 ， 如 果 此 文件 是 一 个 目录 ， 则 | fsize 
自 完 调用 dirwalk 函数 处 理 它 所 包含 的 所 有 文件 。 注 意 如 何 使 用 文件 
<sys/stat.h> 中 的 标志 名 S_IFMT 和 S_IFDIR 来 判定 文件 是 不 是 一 个 目 
孙 。 括 号 是 必须 的 ， 因 为 & 运 算 符 的 优先 级 低 于 == 运 算 符 的 优先 级 。 
int stat(char *, struct stat *); 

void dirwalk(char *, void (*fcn)(char *)); 


/* fsize: print the name of file "name" */ void fsize(char *name) 
{ 

struct stat stbuf; 

if (stat(name, &stbuf) == «1) { 

fprintf(stderr, "fsize: can't access %s\n", name); return; 

} 

if ((stbuf.st_mode & S_IFMT) == S_IFDIR) dirwalk(name, fsize); 
printf("%8ld %s\n", stbuf.st_size, name); 


} 


函数 dirwalk 十 一 个 通用 的 函数 ， 它 对 目录 中 的 每 个 文件 都 调用 函数 
fcn 一次。 它 首 先 打 开 目 录 ， 循 环 避 历 其 中 的 每 个 文件 ， 并 对 每 个 文 
件 调 用 该 男 数 ， 然 后 关闭 目 孙 返回 。 因 为 fsize 函数 对 每 个 目录 都 要 
调用 dirwalk 函数 ， 所 以 这 两 个 函数 征 相 互 递归 调用 的 。 


#define MAX_PATH 1024 


/* dirwalk: apply fcn to all files in dir */ void dirwalk(char *dir, 
void (*fcn)(char *)) 


{ 

char name[MAX_ PATH]; Dirent *dp; 

DIR *dfd; 

if ((dfd = opendir(dir)) == NULL) { 

fprintf(stderr, "dirwalk: can't open %s\n", dir); return; 

} 

while ((dp = readdir(dfd)) != NULL) { if (strcmp(dp*>name, ".") == 0 
|| stremp(dp*>name, "..")) 

continue; /* skip self and parent */ 


if (strlen(dir)+strlen(dpe>name)+2 > sizeof(name)) fprintf(stderr, "dirwalk: 
name %s %s too long\n", 


dir, dp* >name); 

else { 

sprintf(name, "%s/%s", dir, dp*>name); (*fcn)(name); 
} 

} 

closedir(dfd); 


} 


每 次 调用 readdir 都 将 返回 一 个 指针 ， 它 指向 下 一 个 文件 的 信息 。 如 果 
目 孙 中 已 没有 竺 处 理 的 文件 ， 该 函数 将 返回 NULL。 每 个 目录 都 包含 
日 录 “.." 的 页 目 ， 在 处 理 时 必须 跳 过 它们 ， 否 则 将 会 导致 
无 限 循环 。 


到 现在 这 一 步 为 止 ， 代码 与 目录 的 格式 无 关 。 下 一 步 要 做 的 事情 就 是 

在 某 个 具体 的 系统 上 提供 一 个 opendir、readdir 和 closedir 的 最 简单 版 
本 。 以 下 的 函数 适用 于 Version 7 和 System V UNIX 系统， 它们 使 用 了 
头 文 件 (sys/dir.h> 中 的 目录 信息 ， 如 下 所 示 : 


#ifndef DIRSIZ 

#define DIRSIZ 14 

#endif 

struct direct { /* directory entry */ ino_t d_ino; /* 


inode number */ 

char d_name|DIRSIZ]; /* long name does not have '^\0' */ 
le 

某 些 版 本 的 系统 支持 更 长 的 文件 名 和 更 复杂 的 目录 结构 。 

类 型 ino t 是 使 用 typedef 定义 的 类 型 ， 它 用 于 描述 i 结 点 表 的 索引 。 
在 我 们 通常 使 用 的 系统 中 ， 此 类 型 为 unsigned short， 但 是 这 种 信息 不 
应 在 程序 中 使 用 。 因 为 不 同 的 系统 中 该 类 型 可 能 不 同 ， 所 以 使 用 
typedef 定义 要 好 一 些 。 所 有 的 "系统 "类 型 可 以 在 文件 
<sys/types.h) 中 找到 。 


opendir 范 数 首先 打开 目录 ， 验 证 此 文件 苹 一 个 日 录 ( 调 用 系统 调用 


fstat， 它 与 stat 


AMD, 但 它 以 文件 描述 符 作 为 参数 )， 然 后 分 配 一 个 目 隶 结构， 并 你 存 


A J). 


int fstat(int fd, struct stat *); 


/* opendir: open a directory for readdir calls */ DIR *opendir(char 
*dirname) 


{ 

int fd; 

struct stat stbuf; DIR *dp; 

if ((fd = open(dirname, O_RDONLY, 0)) == «1 

|| fstat(fd, &stbuf) == «1 

|| (stbuf.st_mode & S_IFMT) != S_IFDIR 

|| (dp = (DIR *) malloc(sizeof(DIR))) == NULL) return NULL; 
dp*>fd = fd; return dp; 

} 

closedir 函数 用 于 关闭 目录 文件 并 释放 内 存 空间 : 


/* closedir: close directory opened by opendir */ void closedir(DIR 
*dp) 


| 

if (dp) { 

close(dp*>fd); free(dp); 
} 

} 


Bim, KZ readdir 使 用 read AZALI o WRT H 
录 位 置 当 前 没有 使 用 (因为 删除 了 一 个 文件 )， 则 它 的 i 结 点 编号 为 0， 


并 跳 过 该 位 置 。 否 则 ， 将 i 结 点 编号 和 目录 名 放 在 一 个 static 类 型 的 
结构 中 ， 并 给 用 户 返回 一 个 指向 此 结构 的 指针 。 每 次 调用 readdir 函数 
将 覆盖 前 一 次 调用 获得 的 信息 。 


#include <sys/dir.h> /* local directory structure */ 

/* readdir: read directory entries in sequence */ Dirent 
*readdir(DIR *dp) 

{ 

struct direct dirbuf; /* local directory structure */ static 
Dirent d; /* return: portable structure */ 


while (read(dp*>fd, (char *) &dirbuf, sizeof(dirbuf)) 
== sizeof(dirbuf)) { 

if (dirbuf.d_ino == 0) /* slot not in use */ continue; 
d.ino = dirbuf.d_ino; 


strncpy(d.name, dirbuf.d_name, DIRSIZ); d-name[DIRSIZ] = '\0'; 
/* ensure termination */ return &d; 


} 


return NULL; 


} 

尽管 fsize 程序 非常 特殊 ， 但 是 它 的 确 说 明了 一 些 重要 的 思想 。 首 先 ， 
许多 程序 并 不 是 "系统 程序 "， 它 们 仪 仅 使 用 由 操作 系统 维护 的 信息 。 
对 于 这 样 的 程序 ， 很 重要 的 一 点 是 ， 信 恩 的 表示 仪 出 现在 标准 头 文件 
中 ， 使 用 它们 的 程序 只 需要 在 文件 中 包含 这 些 头 文件 即 可 ， 而 不 需要 
包含 相应 的 声明 。 其 次 ， 有 可 能 为 与 系统 相关 的 对 象 创建 一 个 与 系统 
无 天 的 接口 。 标 
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练习 8*5 修改 fsize 程序 ， 打 印 i 结 点 页 中 包含 的 其 它 信 息 。 


8.7 实例 一 一 存储 分 配 程序 


我 们 在 第 5 章 给 出 了 一 个 功能 有 限 的 面向 校 的 存储 分 配 程序 。 本 和 将 
要 编写 的 版 本 没有 限制 ， 可 以 以 任意 次 序 调用 malloc 和 free ° malloc 
在 必要 时 调用 操作 系统 以 获取 更 多 的 存储 空间 。 这 些 程序 说 明了 通过 
一 种 与 系统 无 关 的 方式 编写 与 系统 有 关 的 代码 时 应 考虑 的 问题 ， 同 时 
也 展示 了 结构 、 联 合 和 typedef 的 实际 应 用 。 


malloc 并 不 古 从 一 个 在 编译 时 就 确定 的 固定 大 小 的 数组 中 分 配 存储 空 
间 ， 而 是 在 需要 时 向 操作 系统 申请 空间 。 因 为 程序 中 的 某 些 地 方 可 能 
不 通过 malloc 调用 申请 空间 (也 整 是 说 ， 通 过 其 它 方式 申请 空间 )， 所 
以 ，malloc 管理 的 空间 不 一 定 是 连续 的 。 这 样 ， 空 用 存储 空间 以 空闲 
块 链表 的 方式 组 织 ， 每 个 块 包 含 一 个 长 度 、 一 个 指 癌 下 一 块 的 指针 以 
及 一 个 指向 目 映 存储 空间 的 指针 。 这 些 块 按照 存储 地 址 的 升序 组 织 ， 
最 后 一 块 (最 高 地 址 ) 指 同 第 一 块 ( 参 见 图 8.1D)。 


free het 


free, owned by malloc 


in usc} in use, owned by malloc 


sini | not owned by malloc 


8°1 


当 有 申请 请 求 时 ，malloc 将 扫描 空 闲 块 链表 ， 直 到 找到 一 个 足够 大 的 
块 为 止 。 该 算法 称 为 "首次 适应 "(first fig; 与 之 相对 的 算法 是 "最 佳 适 
应 "(best fib， 它 寻找 满足 条 件 的 最 小 块 。 如 有 果 该 块 恰好 与 请 求 的 大 
小 相符 合 ， 则 将 它 从 链表 中 移 走 并 返回 给 用 户 。 如 采 该 块 太 大 ， 则 将 
它 分 成 两 部 分 :大 小 合适 的 块 返 回 给 用 户 ， 剩 下 的 部 分 留 在 空 采 块 链表 


中 。 如 果 找 不 到 一 个 足够 大 的 块 ， 则 向 操作 系统 申请 一 个 大 块 并 加 入 
到 空闲 块 链表 中 。 


释放 过 程 也 是 首先 搜索 空闲 块 链表 ， 以 找到 可 以 插入 被 释放 块 的 合适 
位 置 。 如 果 与 被 释 放 块 相 邻 的 任 一 边 是 一 个 空 亲 块 ， 则 将 这 两 个 块 合 
成 一 个 更 大 的 块 ， 这 样 存 储 空间 不 会 有 太 多 的 碎片 。 因 为 空 几 块 链表 
Fee em a ci ayer re 
出。 


我 们 在 第 5 章 中 曾 提出 了 这 样 的 问题 ， 即 确保 由 malloc 函数 返回 的 存 
储 空间 满足 将 要 保存 的 对 象 的 对 齐 要 求 。 虽 然 机 器 类 型 各 异 ， 但 是 ， 

每 个 特定 的 机 需 都 有 一 个 最 受 限 的 类 型 : 如 果 最 受 限 的 类 型 可 以 存储 在 
某 个 特定 的 地 址 中 ， 则 其 它 所 有 的 类 型 也 可 以 存放 在 此 地 址 中 。 在 某 
些 机 器 中 ， 最 受 限 的 类 型 是 double 类 型 ;而 在 另外 一 些 机 器 中 ， 最 受 限 
的 类 型 是 int BK long 类 型 。 


空腹 块 包含 一 个 指 回 链表 中 下 一 个 块 的 指针 、 一 个 块 大 小 的 记录 和 一 
个 指 同 空 几 空间 本 


号 的 指针 。 位 于 块 开 始 处 的 控制 信息 称 为 " 头 部 "。 为 了 简化 块 的 对 
齐 ， 所 有 块 的 大 小 都 必 须 是 头 部 大 小 的 整数 倍 ， 且 头 部 已 正确 地 对 
齐 。 这 有 是 通过 一 个 联合 实现 的 ， 该 联合 包含 所 需 的 头 部 结构 以 及 一 个 
对 齐 要 求 最 受 限 的 类 型 的 实例 ， 在 下 面 这 段 程序 中 ， 我 们 假定 long 类 
型 为 最 受 限 的 类 型 : 


typedef long Align; /* for alignment to long boundary */ 
union header { /* block header */ struct { 
union header *ptr; /* next block if on free list */ unsigned size; /* 


size of this block */ 

} S; 

Align x; /* force alignment of blocks */ 
I 

typedef union header Header; 


在 该 联合 中 ，Align 字段 永远 不 会 被 使 用 ， 它 仅仅 用 于 强制 每 个 头 部 在 
最 坏 的 情况 下 满足 对 齐 要 求 。 


在 malloc 函数 中 ， 请 求 的 长 度 (以 字符 为 单位 ) 将 被 伟人 ， 以 保证 它 是 
头 部 大 小 的 整 数 倍 。 实 际 分 配 的 块 将 多 包含 一 个 单元 ， 用 于 头 部 本 
喘 。 实 际 分 配 的 块 的 大 小 将 被 记录 在 头 部 的 size 字段 中 。malloc 函数 
返回 的 指引 将 指 问 空 闪 空间 ， 而 不 是 块 的 头 部 。 用 户 可 对 获 得 的 存储 
空间 进行 任何 操作 ， 但 是 ， 如 果 在 分 配 的 存储 空间 之 外 写 入 数据 ， 则 
可 能 会 破坏 块 链表 。 图 8.2 表示 由 malloc 返回 的 块 。 


-一 一 ~ points to next free block 


size 


ae 


—— address returned to user 


A block returned by malloc 


8°2 malloc 返回 的 块 


其 中 的 size 字段 是 必需 的 ， 因 为 由 malloc 函数 控制 的 块 不 一 定 是 连续 
A, RES 可 能 通过 指针 算术 运算 计算 其 大 小 。 


量 base 表示 空闲 块 链表 的 头 部 。 第 一 次 调用 malloc 函数 时 ，freep 
ened 系统 将 创 aS 它 只 包含 一 个 大 小 为 
0 的 块 ， 且 该 块 指 辣 它 自己 。 任 何 情况 下 ， 当 请 求 空 内 空间 时 ， 都 将 
搜索 空 几 块 和 链表。 搜索 从 上 一 次 找到 空 闪 块 的 地 方 (freep) FF UR ° AR 
格 可 以 保证 链表 是 均匀 的 。 如 果 找 到 的 块 太 大 ， 则 将 其 尾部 返回 给 用 
Fs SO 初始 块 的 类 部 只 需要 修改 size 字段 即 可 。 o 在 任何 情况 下 ， 
ree ee SETARE RAR eee la], REEE S ABAI SET 
al JES 


static Header base; /* empty list to get started */ static Header 
*freep = NULL; /* start of free list */ 
/* malloc: generalepurpose storage allocator */ void 


*malloc(unsigned nbytes) 


{ 
Header *p, *prevp; 
Header *moreroce(unsigned); unsigned nunits; 


nunits = (nbytes+sizeof(Header)+1)/sizeof(header) + 1; if ((prevp = freep) 
== NULL) { /* no free list yet */ 


base.s.ptr = freeptr = prevptr = &base; base.s.size = 0; 


} 


for (p = prevp*>s.ptr; ; prevp = p, p = p*>s.ptr) { if (p*>s.size >= nunits) 
{ /* big enough */ 


if (pe>s.size == nunits) /* exactly */ prevp*>s.ptr = pe>s.ptr; 
else { /* allocate tail end */ p*>s.size °= nunits; 

p += pe>s.size; pe>s.size = nunits; 

} 

freep = prevp; 


return (void *)(p+1); 


} 

if (p == freep) /* wrapped around free list */ if ((p = 
morecore(nunits)) == NULL) 

return NULL; /* none left */ 

} 


} 


函数 morecore 用 于 问 操 作 系 统 请 求 存 储 空 间 ， 其 实现 细节 因 系 统 的 不 
同 而 不 同 。 因 为 癌 系 统 请 求 存储 空间 是 一 个 开销 很 大 的 操作 ， 因 此 ， 
我 们 不 希望 每 次 调用 malloc 函数 时 都 执行 该 操作 ， 基 于 这 个 考虑 ， 
morecore 函数 请 求 至 少 NALLOC 个 单元 。 这 个 较 大 的 块 将 根 据 需 要 
分 成 较 小 的 块 。 在 设置 完 size 字段 之 后 ，morecore 函数 调用 free AK 
把 多 余 的 存 储 空 间 插入 到 空间 区 域 中 。 


UNIX 系统 调用 sbrk(n) 返 回 一 个 指针 ， 该 指针 指向 n 个 字 市 的 存储 空 
间 。 如 有 果 没 有 空 内 空间 ， 尺 管 返回 NULL 可 能 更 好 一 些 ， 但 sbrk 调 
用 返回 ,1。 必 须 将 *1 强制 转换 为 char * 类 型 ， 以 便 与 返回 值 进行 比 
较 。 而 且 ， 强 制 类 型 转换 使 得 该 贸 数 不 会 受 不 同 机 器 中 指针 表示 的 不 
同 的 影响 。 但 是 ， 这 里 仍然 假定 ， 由 sbrk 调用 返回 的 指 问 不 同 块 的 多 
个 指针 之 间 可 以 进行 有 意义 的 比较 。ANSI 标准 并 没有 保证 这 一 点 ， 
它 只 允许 指 回 同一 个 数组 的 指针 间 的 比较 。 因此， 只 有 在 一 般 指 针 间 
的 比较 操作 有 意义 的 机 器 上 ， 该 版 本 的 malloc 函数 才能 够 移植 。 


#define NALLOC 1024 /* minimum #units to request */ 


/* morecore: ask system for more memory */ static Header 
*morecore(unsigned nu) 


{ 

char *cp, *sbrk(int); Header *up; 

if (nu < NALLOC) nu = NALLOC; 

cp = sbrk(nu * sizeof(Header)); 

if (cp == (char *) 1) /* no space at all */ return NULL; 


up = (Header *) cp; 


up*>s.size = nu; free((void *)(up+1)); return freep; 
} 


我 们 最 后 来 看 一 下 free KA o EM freep 指 辐 的 地 址 开始 ， 逐 个 扫描 
空闲 块 链表 ， 寻 找 可 以 插入 空 几 块 的 地 方 。 该 位 置 可 能 在 两 个 空 闪 块 
之 间 ， 也 可 能 在 链表 的 末尾 。 在 任何 一 种 情况 下 ， 如 果 被 释放 的 块 与 
男 一 空 闪 块 相 邻 ， 则 将 这 两 个 块 合并 起 来 。 合 并 两 个 块 的 操作 很 简 

， 只 需要 设置 指针 指向 正确 的 位 置 ， 并 设置 正确 的 块 大 小 束 可 以 
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/* free: put block ap in free list */ void free(void *ap) 

{ 

Header *bp, *p; 

bp = (Header *)ap ° 1; /* point to block header */ 


for (p = freep; !(bp > p && bp < p*>s.ptr); p = pe>s.ptr) if (p >= p*>s.ptr 
&& (bp > p || bp < ps>s.ptr)) 


break; /* freed block at start or end of arena */ 


if (bp + bp*>size == pe>s.ptr) { /* join to upper nbr */ bp*>s.size 
+= pe>s.ptre>s.size; 


bpe*>s.ptr = p*>s.ptre>s. ptr; 
} else 
bpe>s.ptr = pe>s.ptr; 


if (p + p*>size == bp) { /* join to lower nbr */ p*>s.size += 
bpe>s.size; 


pe>s.ptr = bpe>s.ptr; 


} else 
p*>s.ptr = bp; freep = p; 
} 


虽然 存储 分 配 从 本 质 上 是 与 机 器 相 关 的 ， 但 是 ， 以 上 的 代码 说 明了 如 
HAAN Las 相关 的 部 分 ， 并 将 这 部 分 程序 控制 到 最 少量 。 
typedef 和 union 的 使 用 解决 了 地 址 的 对 齐 (假定 sbrk 返回 的 是 合适 的 
和 针 ) 问 题 。 类 型 的 强制 转换 使 得 指针 的 转换 是 显 式 进 行 的 ， 这 样 做 
甚至 可 以 处 理 设计 不 够 好 的 系统 接口 问题 。 虽 然 这 里 所 讲 的 内 容 只 涉 
及 到 存储 分 配 ， 但 是 ， 这 种 通用 方法 也 适用 于 其 它 情 况 。 


练习 8。6 标准 库 函 数 calloc(n, size) 返 回 一 个 指针 ， 它 指向 n 个 长 度 为 
size 的 对 象 ， 且 所 有 分 配 的 存储 空间 都 被 初始 化 为 0° 通过 调用 或 修 
PX malloc 函数 来 实现 calloc 函数 。 


练习 8.7 malloc 接收 对 存储 空间 的 请 求 时 ， 并 不 检查 请 求 长 度 
的 合理 性 ;而 free 


则 认为 被 释放 的 块 包含 一 个 有 效 的 长 度 字 段 。 改 进 这 些 钞 数 ， 使 它们 
具有 错误 检查 的 功能 。 


练习 8.8 ”编写 函数 bfree(p, n)， 释 放 一 个 包含 n 个 字符 的 任意 块 p， 
并 将 它 放 入 由 malloc 和 free 维护 的 空 闪 块 链表 中 。 通 过 使 用 bfree, 
用 户 可 以 在 任意 时 刻 回 空闲 块 链表 中 添加 一 个 静态 或 外 部 数组 。 


附录 A 参考 手册 


A.1 引言 


本 手册 描述 的 C 语言 是 1988 年 10 月 31 日 提交 给 ANSI 的 草案 ， 批 准 
号 为 "美国 国家 信 息 系 统 标 准 一 一 C 程序 设计 语言 ，X3.159.1989"。 尽 
管 我 们 已 尽 最 大 努力 ， 力 求 准确 地 将 该 手 册 作 为 C 语言 的 指南 介绍 给 
读者 ， 但 它 毕 竟 不 是 标准 本 号， 而 仅仅 只 是 对 标准 的 一 个 解释 而 已 。 


该 手册 的 组 织 与 标准 基本 类 似 ， 与 本 书 的 第 1 版 也 类 似 ， 但 是 对 细 市 
的 组 织 有 些 不 同 。 本 手册 给 出 的 语法 与 标准 古 相 同 的 ， 但 是 ， 其 中 少 
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本 手册 中 ， 说 明 部 分 的 文字 指出 了 ANSI 标准 C 语言 与 本 书 第 1 版 定 
义 的 C 语言 或 其 它 编译 如 文 持 的 语言 之 间 的 差别 。 


A.2 词法 规则 


程序 由 存储 在 文件 中 的 一 个 或 多 个 翻译 单元 (translation unit) 组 成 。 程 
序 的 翻译 分 儿 个 阶段 完成 ， 这 部 分 内 容 将 在 A.12 蔬 中 介绍 。 翻 译 的 
第 一 阶段 完成 低级 的 词法 转换 ， 执 行 以 字 符 # 开 头 的 行 中 的 指令 ， 并 
进行 宏 定 义 和 宏 扩展 。 在 预 处 理 ( 将 在 A.12 市 中 介绍 ) 完 成 后 ， 程 序 被 
归 约 成 一 个 记号 序列 。 

A.2.1 记号 

C 语言 中 共有 6 Rid SAG KES. PS. SARS aE 
符 和 其 它 分 隔 符 。 衬 格 ， 横 辐 制 表 符 和 纵 辐 制 表 符 、 换 行 符 ， 换 页 符 
和 注释 (统称 空 日 符 ) 在 程序 中 仅 用 来 分 隔 记 号 ， 因 此 将 被 忽略 。 相 邻 
的 标识 符 、 关 键 字 和 销量 之 间 需 要 用 空白 符 来 分 隔 。 


如 条 到 某 一 字符 为 止 的 输入 流 被 分 隔 成 春 干 记号 ， 那 么 ， 下 一 个 记号 
MER EFIT] 中 可 能 构成 记号 的 最 长 的 字符 串 。 


A.2.2 注释 


EEA, DEER o EEDE, EAREN ES 
of BF ESA 字面 值 中 。 


A.2.3 标识 符 

标识 符 是 由 字母 和 数字 构成 的 序列 。 第 一 个 字符 必须 是 字母 ， 下 划 线 “ 
_" 也 被 看 成 是 字 母 。 大 写字 母 和 小 写字 母 是 不 同 的 。 标 识 符 可 以 为 任 
意 长 度 。 对 于 内 部 标识 符 来 说 ， 至 少 前 31 个 字母 是 有 效 的 ， 在 某 些 实 
现 中 ， 有 效 的 字符 数 可 能 更 多 。 内 部 标识 符 包 括 预 处 理 屁 的 宏 名 和 其 
它 所 有 没有 外 部 连接 (参见 A.11.2 节 ) 的 名 字 。 带 有 外 部 连接 的 标识 符 
的 限制 更 严格 实现 可 能 只 认为 这 些 标识 符 的 前 6 个 字符 是 有 效 
的 ， 而 且 有 可 能 忽略 大 小 写 的 不 同 。 

A.2.4 KF 


下 列 标识 符 被 保留 作为 天 键 子 ， 且 不 能 用 于 其 它 用 途 : 


double else struct switch 


char extern return junion 
const float short (unsigned 


> 


for signed lvoid 
goto sizeof Ivolatile 
pf ep 


某 些 实现 还 把 fortran 和 且 asm 保留 为 天 键 字 。 


说 明 : 关 键 字 const ` signed 和 volatile 是 ANSI 标准 中 新 增加 的 ;enum 
和 void 是 第 1 版 后 新 增加 的 ， 现 已 被 广泛 应 用 ;entry 曾经 被 集 留 为 天 
键 字 但 从 未 被 使 用 过 ， 现 在 已 经 不 是 了 。 


A.2.5 ih E 


常量 有 多 种 类 型 。 每 种 类 型 的 常量 都 有 一 个 数据 类 型 。 基 本 数据 类 型 
将 在 A.4.2 节 讨 论 。 常量 : 


wr pl, 


整 型 常量 字符 常量 浮 点 常量 枚 举 常量 
1. 整 型 销量 


整 型 音量 由 一 串 数 字 组 成 。 如 有 果 它 以 数字 0 开头 ， 则 为 八进制 数 ， 否 
则 为 十 进 制 数 。 八 进 制 前 量 不 包括 数字 8 和 9， 以 0x 和 0X 开头 的 数 
字 序 列表 示 十 六 进 制 数 ， 十 六 进 制 数 包 侣 从 a( 或 A) 到 ff( 或 F) 的 字母 ， 
它们 分 别 表示 数值 10 到 15。 


整 型 常量 者 以 字母 或 U 为 后 级 ， 则 表示 它 是 一 个 无 符号 数 ;者 以 字母 
1 或 工 为 后 级 ， 则 表示 它 是 一 个 长 整 型 数 ; 厦 以 字母 UL KER, MWR 
示 它 是 一 个 无 符号 长 整 型 数 。 


整 型 常量 的 类 型 同 它 的 形式 、 值 和 后 纵 有 关 ( 有 关 类 型 的 讨论 ， 参 见 
A.4 广 )。 如 果 它 没有 后 级 且 是 十 进 制 表示 ， 则 其 类 型 很 可 能 是 int ` 
long int 或 unsigned long int ° 4] 


采 它 没有 后 缀 且 是 八进制 或 十 六 进 制 表示 ， 则 其 类 型 很 可 能 是 int、 
unsigned int ` long int 或 unsigned long int ° 如果 它 的 后 缀 为 u 或 U， 则 
其 类 型 很 可 能 是 unsigned int 或 ungigned long int。 如 果 它 的 后 级 为 1 或 
L， 则 其 类 型 很 可 能 是 long int 或 unsigned long int ° 


说明:ANSI 标准 中 ， 整 型 第 量 的 类 型 比 第 1 版 要 复杂 得 多 。 在 第 1 版 
中 ， 大 的 整 型 常量 仅 被 看 做 是 long 类 型 。U 后 级 是 新 增加 的 。 
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字符 常量 的 值 是 执 行 时 机 器 字符 集中 此 字符 对 应 的 数值 ， 多 字符 常量 
的 值 由 具体 实现 定义 。 


字符 常量 不 包括 字符 ' 和 换行 符 ， 可 以 使 用 以 下 转 义 字符 序列 表示 这 些 
字符 以 及 其 它 一 些 FIF: 


MES AE [BEL 四 | 


转 义 序列 \ooo 由 反 斜 杠 后 跟 1 个 、2 个 或 3 个 八进制 数字 组 成 ， 这 些 
八进制 数字 用 来 指 定 所 期 望 的 字符 的 值 。\O( 其 后 没有 数字 ) 便 是 一 个 
常见 的 例子 ， 它 表示 字符 NUL。 转 义 序 列 \xhh F, KEHE EKER x 
以 及 十 六 进 制 数字 ， 这 些 十 六 进 制 数 用 来 指定 所 期 望 的 字符 的 值 。 数 
字 的 个 数 没 有 限制 ， 但 如 果 字 符 值 超过 最 大 的 字符 值 ， 该 行为 是 未 定 
义 的 。 对 于 八 进 制 或 十 六 进 制 较 义 字符 ， 如 采 实 现 中 将 类 型 char 看 做 
征 市 符号 的 ， 则 将 对 字符 值 进行 符号 扩 展 ， 束 好 像 它 被 强制 转换 为 

char 类 型 一 样 。 如 果 \ 后 面 紧 跟 的 字符 不 在 以 上 指定 的 字符 中 ， 则 其 行 
为 是 未 定义 的 。 


在 C 语言 的 某 些 实现 中 ， 还 有 一 个 扩展 的 字符 集 ， 它 不 能 用 char 类 型 
表示 。 扩 展 集中 的 种 量 要 以 一 个 前 导 符 工 开头 (例如 Lx e), A w 
字符 常量 。 这 种 常量 的 类 型 为 wchar t。 这 是 一 种 整 型 类 型 ， 定 义 在 
标准 头 文件 <stddef.h> 中 。 与 通常 的 字符 常量 一 样 ， 宽 字符 第 量 可 以 
使 用 八进制 或 十 六 进 制 较 义 字符 序列 ;但 是 ， 如 时 值 超过 wehar_t 可 以 
表示 的 范围 ， 则 结果 是 未 定义 的 。 


说 明 : 茶 些 较 义 序列 是 新 增加 的 ， 符 别 是 十 六 进 制 字符 的 表示 。 扩 展 字 
符 也 是 新 增加 的 。 通 常情 况 下 ， 美 国 和 西欧 所 用 的 字符 集 可 以 用 char 
类 型 进行 编码 ， 增 加 wchar t 的 主要 目的 是 为 了 表示 亚洲 的 语言 。 


3. 浮 点 常量 


浮 点 常量 由 整数 部 分 、 小 数 点 、 小 数 部 分 、 一 个 e 或 下、 一 个 可 选 的 
带 和 从 号 整 型 类 型 的 指数 和 一 个 可 选 的 表示 类 型 的 后 级 ( 即 f、F、1 或 L 
之 一 ) 组 成 。 整数 和 小 数 部 分 均 由 数字 序 列 组 成 。 可 以 没有 整数 部 分 
或 小 数 部 分 (但 不 能 两 者 都 没有 )， 还 可 以 没有 小 数 点 或 者 e 和 指 数 部 
分 (但 不 能 两 者 都 没有 )。 浮 点 常量 的 类 型 由 后 级 确定 ，F 或 f 后 级 表示 
它 是 float 类 型 ; ] BY L 后 级 表明 它 是 long double 类 型 ;没有 后 级 则 表明 
是 double 类 型 。 


说 明 : 浮 点 常量 的 后 级 是 新 增加 的 。 

4. 枚 举 常量 

声明 为 枚 举 符 的 标识 符 是 int 类 型 的 常量 (参见 A.8.4 T) 。 
A.2.6 FI BE 


字符 串 字 面值 (string literal) 也 称 为 字符 串 常 量 ， 是 用 双 引 号 引起 来 的 
一 个 字符 序列 ， 如 “...”。 字 符 串 的 类 型 为 "字符 数组 "， 存 储 类 为 
static( 参 见 A.4 节 )， 它 使 用 给 定 的 字符 进行 初始 化 。 对 相同 的 字符 串 
字面 值 是 否 进行 区 分 取决 于 具体 的 实现 。 如 采 程 序 试图 修改 字 FEF 
面值 ， 则 行为 是 未 定义 的 。 


我 们 可 以 把 相 邻 的 子 符 串 字面 值 连接 为 一 个 单一 的 字符 串 。 执 行 任何 
连接 操作 后 ， 都 将 ES Re SN TASS NO, GE, FT 
符 串 的 程序 便 可 以 找到 字符 串 的 结束 位 置 。 字符 串 字 面值 不 包含 换行 
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与 字符 常量 一 样 ， 扩 展 字 符 集 中 的 字符 串 字 面值 也 以 前 导 符 工 表示 ， 
QU L"..." o BORA 字符 串 字 面值 的 类 型 为 * wchar t 类 型 的 数组 "。 将 普 
通 字符 串 字 面值 和 视 字 符 字 符 串 字面 值 进行 连接 的 行为 是 未 定义 的 。 
说 明 : 下 列 规定 都 是 ANSI 标准 中 新 增加 的 :字符 串 字 面值 不 必 进 行 区 
T` EIFE PFE Be SP Be EF ETER o T 
字符 字符 串 字 面值 也 是 ANSI 标准 中 新 增加 的 。 

A.3 语法 符号 

在 本 手册 用 到 的 语法 符号 中 ， 语法 类 别 用 楷体 及 斜体 字 表 示 。 文 字 和 
字符 以 打字 型 字体 表 不 > 多 个 候选 类 别 通 常 列 在 不 同 的 行 中 ， 但 在 一 
些 情况 下 ， 一 组 字符 长 度 较 短 的 候选 页 可 以 放 在 一 行 中 ， 并 以 短语 “ 
one of 名 标识。 可 选 的 终结 符 或 非 终结 符 带 有 下 标 “ opt"。 例 如 : 


{ 表达 式 ，} 


表示 一 个 括 在 花 括 号 中 的 表达 式 ， 该 表达 式 是 可 选 的 。A.13 PAEA 
进行 了 总 结 。 说 明 : 与 本 书 第 1 版 给 出 的 语法 所 不 同 的 是 ， 此 处 给 
的 语法 将 表达 式 运 算 符 的 优先 级 


和 结合 性 显 式 表达 出 来 了 。 
A.4 标识 符 的 含义 


标识 符 也 称 为 名 字 ， 可 以 指 代 多 种 实体 :函数 、 结 构 标 记 、 联 合 标记 和 
枚 举 标记 ;结构 成 员 或 联合 成 员 ; 枚 举 常 量 ;类 型 定义 名 ;标号 以 及 对 象 

等 。 对 象 有 时 也 称 为 变量 ， 它 古 一 个 存储 位 置 。 对 它 的 解释 依赖 于 两 
个 主要 属性 :存储 类 和 类 型 。 存 储 类 决定 了 与 该 标识 对 象 相关 联 的 存储 
区 域 的 生存 期 ， 类 型 决定 了 标识 对 象 中 值 的 含义 。 名 字 还 具有 一 个 作 
用 域 和 一 个 连接 。 作 用 域 即 程序 中 可 以 访问 此 名 字 的 区 域 ， 连 接 决 定 
男 一 作用 域 中 的 同一 个 名 字 是 否 


指 辐 同一 个 对 象 或 函数 。 作 用 域 和 连接 将 在 A.11 节 中 讨论 ° 
A.4.1 存储 类 


存储 类 分 为 两 类 :自动 存储 类 (automatic) 和 静态 存储 类 (static)。 声 明 对 
象 时 使 用 的 一 些 关 键 字 和 声明 的 上 下 文 共同 决定 了 对 象 的 存储 类 。 H 
动 存储 类 对 象 对 于 一 个 程序 块 (参见 A.9.3 节 ) 来 说 是 局 部 的 ， 在 退出 程 
序 块 时 该 对 象 将 消失 。 如 采 没 有 使 用 存储 类 说 明 符 ， 或 者 如 果 使 用 了 
auto 限定 符 ， 则 程序 块 中 的 声明 生成 的 都 是 目 动 存储 类 对 象 。 声 明 为 
register 的 对 和 象 也 是 目 动 存储 类 对 象 ， 并 且 将 被 存储 在 机 器 的 快速 寄存 
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对 象 。 无 论 是 哪 一 种 情况 ， 在 退出 和 再 进入 函数 或 程序 块 时 其 值 将 保 
持 不 变 。 在 一 个 程序 块 (包括 提供 函数 代 码 的 程序 块 ) 内 ， 静 态 对 象 用 
KEF static 声明 。 在 所 有 程序 块 外 部 声明 且 与 琴 数 定义 在 同一 级 的 
对 象 总 是 静态 的 。 可 以 通过 static 关键 字 将 对 象 声 明 为 某 个 特定 翻译 
单元 的 局 部 对 象 ， 这 种 类 型 的 对 象 将 具有 内 部 连接 。 当 省 略 显 式 的 存 
储 类 或 通过 关键 字 extern 进行 声 明 时 ， 对 象 对 整个 程序 来 说 是 全 局 可 
访问 的 ， 并且 具 有 外 部 连接 。 


A.4.2 基本 类 型 


基本 类 型 包括 多 种 。 附 好 B 中 描述 的 标准 头 文件 <limits.h> 中 定义 了 本 
类 型 的 最 大 值 和 最 小 值 。 附 录 B 给 出 的 数值 表示 最 小 的 
A] RSPR ° 


声明 为 字符 (chan 的 对 象 要 大 到 足以 存储 执行 字符 集中 的 任何 字符 。 如 
果 字 符 集 中 的 某 个 字符 存储 在 一 个 char 类 型 的 对 象 中 ， 则 该 对 象 的 值 
等 于 字符 的 整 型 编码 值 ， 并 且 十 非 负 值 。 其 它 类 型 的 对 象 也 可 以 存储 
在 char 类 型 的 变量 中 ， 但 其 取 值 范围 ， 特 别 是 其 值 是 否 市 符 号 ， 同 有 具 
体 的 实现 有 关 。 


以 unsigned char 声明 的 无 符号 字符 与 普通 字符 占用 同样 大 小 的 空间 ， 
但 其 值 总 是 非 负 的 。 以 signed char 显 式 声明 的 市 符号 字符 与 普通 字符 
也 占用 同样 大 小 的 空间 。 


说 明 : 本 书 的 第 1 版 中 没有 unsi gned char 类 型 ， 但 这 种 用 法 很 常见 。si 
gned char 是 新 增加 的 。 


除 char 类 型 外 ， 还 有 3 种 不 同 大 小 的 整 型 类 型 :short int ` int 和 long 
int。 普 通 int 对 象 的 长 度 与 由 宿主 机 器 的 体系 结构 决定 的 自然 长 度 相 
同 。 其 它 类 型 的 整 型 可 以 满足 各 种 特殊 的 用 途 。 较 长 的 整数 至 少 要 占 
有 与 较 短 整数 一 样 的 存储 空间 ;但 是 具体 的 实现 可 以 使 得 一 般 整 型 (int) 
与 短 整 型 (short int) 或 长 整 型 (long in 具有 同样 的 大 小 。 除非 特别 说 
明 ，int 类 型 都 表示 带 符 号 数 。 


以 关键 字 unsigned 声明 的 无 符号 整数 遵守 算术 模 2" 的 规则 ， 其 中 ,，n 
征 表 示 相 应 整数 的 二 进 制 位 数 ， 这 样 ， 对 无 符号 数 的 算术 运算 永远 不 
会 游 出 。 可 以 存储 在 之 符号 对 象 中 的 非 负 值 的 集合 是 可 以 存储 在 相应 
ce eee HHA, TREN BOY 表示 十 


单 精度 浮 点 数 (float)、 双 精度 浮 点 数 (double) 和 多 精度 浮 点 数 (long 
double) 中 的 任何 类 型 都 可 能 是 同 义 的 ， 但 狂 度 从 前 到 后 是 递增 的 。 


说 明 :] ong doubl e 是 新 增加 的 类 型 。 在 第 1 版 中 ，1ongfloat 与 doubl 
e 类 型 等 价 ， 但 现在 是 不 相同 的 。 

枚 举 是 一 个 具有 整 型 值 的 特殊 的 类 型 。 与 每 个 枚 举 相 关联 的 是 一 个 命 
名 和 常量 的 集合 ( 参 见 A.8.4 让 )。 枚 举 类 型 类 似 于 整 型 。 但 是 ， 如 果 某 
个 特定 枚 举 类 型 的 对 象 的 赋值 不 是 其 常量 中 的 一 个 ， 或 者 赋值 不 是 一 
个 同类 型 的 表达 式 ， 则 编译 需 通 常会 产生 警告 信息 。 

因为 以 上 这 些 类 型 的 对 象 都 可 以 被 解释 为 数字 ， 所 以 ， 可 以 将 它们 统 
称 为 算术 类 型 。char 类 型 、 各 种 大 小 的 int 类 型 (无 论 是 否 带 符号 ) 以 及 
枚 举 类 型 都 统称 为 整 型 类 型 (integral type) ° XÆ float ` double 和 long 
double 统称 为 浮 点 类 型 (floating type) ° 


a 


A.4.3 派生 类 型 


除 基 本 类 型 外 ， 我 们 还 可 以 通过 以 下 几 种 方法 构造 派生 类 型 ， 从 概念 
来 讲 ， 这 些 派生 类 型 可 以 有 无 限 多 个 : 


给 定 类 型 对 象 的 数组 

返回 给 定 类 型 对 象 的 函数 

指向 给 定 类 型 对 象 的 指针 

包含 一 系列 不 同类 型 对 象 的 结构 

可 以 包含 多 个 不 同类 型 对 象 中 任意 一 个 对 象 的 联合 
一 般 情 况 下 ， 这 些 构 造 对 象 的 方法 可 以 递归 使 用 。 
A.4.4 类 型 限定 符 


对 和 象 的 类 型 可 以 通过 附加 的 限定 符 进行 限定 。 声 明 为 const 的 对 象 表 
明 此 对 象 的 值 不 可 以 修改 ;声明 为 volatile 的 对 象 表明 它 具 有 与 优化 相 


天 的 特殊 属性 。 限 定 符 既 不 影响 对 象 取 值 的 范围 ， 也 不 影响 其 算术 属 
性 。 限 定 符 将 在 A.8.2 节 中 讨论 。 


A.5 对 象 和 左 值 


对 象 是 一 个 命名 的 存储 区 域 ， 左 值 (lvalue) 是 引用 某 个 对 象 的 表达 式 。 
具有 合适 类 型 与 存储 类 的 标识 符 便 十 左 值 表达 式 的 一 个 明显 的 例子 。 
某 些 运算 符 可 以 产生 左 值 。 例 如 ， 如 果 玉 十 一 个 指针 类 型 的 表达 式 ， 
*E 则 是 一 个 左 值 表 达 式 ， 它 引用 由 玉 指 同 的 对 象 。 名字 " 左 值 ” 来 源 
于 赋值 表达 式 E1=E2， 其 中 ， 左 操作 数 E1 必须 十 一 个 左 值 表达 式 .。 
对 每 个 运算 符 的 讨论 需要 说 明 此 运算 符 是 否 需要 一 个 左 值 操作 数 以 及 
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A.6 转换 
根据 操作 数 的 不 同 ， 某 些 运算 符 会 引起 操作 数 的 值 从 某 种 类 型 转换 为 


另 一 种 类 型 。 本 世 将 说 明 这 种 转换 产生 的 结果 。A.6.5 市 将 讨论 大 多 
数 普 通 运算 符 所 要 求 的 转换 ， 我 们 在 讲解 每 


个 运算 符 时 将 做 一 些 补充 。 
A.6.1 整 型 提升 


在 一 个 表达 式 中 ， 几 是 可 以 使 用 整 型 的 地 方 都 可 以 使 用 带 符 号 或 无 符 
号 的 字符 、 短 整 型 或 整 型 位 字段 ， 还 可 以 使 用 枚 举 类 型 的 对 象 。 如 果 
原始 类 型 的 所 有 值 都 可 用 int 类 型 表示 ， 则 其 值 将 被 转换 为 int 类 型 ; 
否则 将 被 转换 为 unsigned int 类 型 。 这 一 过 程 称 为 整 型 提 升 (integral 


promotion) ° 
A.6.2 整 型 转换 


将 任何 整数 转换 为 采种 指定 的 无 符号 类 型 数 的 方法 是 :以 该 无 符号 类 型 
能 够 表示 的 最 大 值 加 1 为 模 ， 找 出 与 此 整数 同 余 的 最 小 的 非 负 值 。 在 
对 二 的 补 码 表 示 中 ， 如 果 该 无 符号 类 型 的 位 模式 较 罕 ， 这 就 相当 于 左 
截取 ;如 有 果 该 无 符号 类 型 的 位 模式 较 宽 ， 这 束 相 当 于 对 珊 符 号 值 进 行 符 
号 扩展 和 对 无 符号 值 进行 0 填充 。 


将 任何 整数 转换 为 市 符号 类 型 时 ， 如 果 它 可 以 在 新 类 型 中 表示 出 来 ， 
则 其 值 保持 不 变 ， 否则 它 的 值 同 具体 的 实现 有 关 。 


A.6.3 整数 和 浮 点 数 


当 把 浮 点 类 型 的 值 转换 为 整 型 时 ， 小 数 部 分 将 被 丢弃 。 如 果 结 采 值 不 
能 用 整 型 表示 ， 则 其 行为 是 未 定义 的 。 特 别 是 ， 将 负 的 译 点 数 转换 为 
无 符号 整 型 的 结果 是 没有 定义 的 。 


当 把 整 型 值 转换 为 浮 点 类 型 时 ， 如 果 该 值 在 该 浮 点 类 型 可 表示 的 范围 
内 但 不 能 精确 表示 ， 则 结 采 可 能 是 下 一 个 较 高 或 较 低 的 可 表示 值 。 如 
果 该 值 超 出 可 表示 的 范围 ， 则 其 行为 是 未 定义 的 。 


A.6.4 浮 点 类 型 
将 一 个 精度 较 低 的 浮 点 值 转换 为 相同 或 更 高 精度 的 浮 点 类 型 时 ， 它 的 
值 保持 不 变 。 将 一 个 较 高 精度 的 浮 点 类 型 值 转换 为 较 低 精度 的 浮 点 类 


型 时 ， 如 果 它 的 值 在 可 表示 范围 内 ， 则 结 果 可 能 是 下 一 个 较 高 或 较 低 
的 可 表示 值 。 如 果 结 果 在 可 表示 范围 之 外 ， 则 其 行为 是 未 定义 的 。 


A.6.5 算术 类 型 转换 


许多 运算 符 都 会 以 类 似 的 方式 在 运算 过 程 中 引起 转换 ， 并 产生 结 采 类 
型 。 其 效果 是 将 所 有 操作 数 转 换 为 同一 公共 类 型 ， 并 以 此 作为 结果 的 
类 型 。 这 种 方式 的 转换 称 为 普通 算术 类 型 转换 。 


首先 ， 如 果 任 何 一 个 操作 数 为 long double 类 型 ， 则 将 另 一 个 操作 数 转 
换 为 long double 类 型 。 


和 否则， 如果 任何 一 个 操作 数 为 double 类 型 ， 则 将 另 一 个 操作 数 转换 为 
double 类 型 。 


否则 ， 如 采 任 何 一 个 操作 数 为 float 类 型 ， 则 将 另 一 个 操作 数 转换 为 
float 类 型 。 否则 ， 同 时 对 两 个 操作 数 进行 整 型 提升 ;然后 ， 如 采 任 何 
一 个 操作 数 为 unsigned long 


int 类 型 ， 则 将 为 一 个 操作 数 转换 为 unsigned long int 类 型 。 


否则 ， 如 果 一 个 操作 数 为 long int 类 型 且 另 一 个 操作 数 为 unsigned int 
类 型 ， 则 结果 依赖 于 long int 类 型 是 否 可 以 表示 所 有 的 unsigned int 类 
型 的 值 。 如 果 可 以 ， 则 将 unsigned int 类 型 的 操作 数 转换 为 long int; 如 
果 不 可 以 ， 则 将 两 个 操作 数 都 转换 为 unsigned long int 类 型 。 


否则 ， 如 果 一 个 操作 数 为 long int 类 型 ， 则 将 另 一 个 操作 数 转换 为 
long int 类 型 。 否则， 如果 任 何 一 个 操作 数 为 unsigned int 类 型 ， 则 将 
另 一 个 操作 数 转换 为 unsigned 


int 类 型 。 
人 否则， 将 两 个 操作 数 都 转换 为 int 类 型 。 


说 明 :这 里 有 两 个 变化 。 第 一 ， 对 float 类 型 操作 数 的 算术 运算 可 以 只 
用 单 精度 而 不 是 双 精度 ;而 在 第 1 版 中 规定 ， 所 有 的 浮 点 运算 都 是 双 
精度 。 第 二 ， 当 较 短 的 无 符号 类 型 与 较 


长 的 市 符号 类 型 一 起 运算 时 ， 不 将 无 符号 类 型 的 属性 传递 给 结 采 类 型 ; 
而 在 第 1 版 中 ， 无 符 号 类 型 总 是 处 于 文 配 地 位 。 痢 规则 稍微 复杂 一 
些 ， 但 减少 了 无 符号 数 与 融和 从 号 数 混合 使 用 情 况 下 的 麻烦 ， 当 一 个 无 
符号 表达 式 与 一 个 具有 同样 长 度 的 市 符号 表达 式 相 比较 时 ， 结 果 仍 然 
征 无 法 预料 的 。 


A.6.6 指针 和 整数 


指针 可 以 加 上 或 减 去 一 个 整 型 表达 式 。 在 这 种 情况 下 ， 整 型 表达 式 的 
转换 按照 加 法 运算 符 的 方式 进行 (参见 A.7.7 1) ° 


两 个 指向 同一 数组 中 同一 类 型 的 对 象 的 指针 可 以 进行 减法 运算 ， 其 结 
果 将 被 转换 为 整 型 ; 转换 方式 按照 减法 运算 符 的 方式 进行 (参见 A.7.7 
1) e 


值 为 0 的 整 型 常量 表达 式 或 强制 转换 为 void * 类 型 的 表达 式 可 通过 强 
制 转换 、 赋 值 或 比 较 操 作 转 换 为 任意 类 型 的 指针 。 其 结果 将 产生 一 个 
空 指针 ， 此 空 指针 等 于 指向 同一 类 型 的 男 一 空 指针 ， 但 不 等 于 任何 指 
回 函 数 或 对 象 的 指针 。 


还 允许 进行 指针 相关 的 其 它 某 些 转换 ， 但 其 结 采 依赖 于 具体 的 实现 。 
这 些 转换 必须 由 一 个 显 式 的 类 型 转换 运算 符 或 强制 类 型 转换 来 指定 
(参见 A.7.5 TM A.8.8 T) ° 


指针 可 以 转换 为 整 型 ,但 此 整 型 必须 足够 大 ;所 要 求 的 大 小 依赖 于 具体 
的 实现 。 映 射 画 数 也 依赖 于 具体 的 实现 。 


整 型 对 象 可 以 显 式 地 转换 为 指针 。 这 种 映射 总 是 将 一 个 足够 宽 的 从 指 
针 转 换 来 的 整数 转 换 为 同一 个 指针 ， 其 它 情 况 依 赖 于 具体 的 实现 。 


指 回 某 一 类 型 的 指针 可 以 转换 为 指向 男 一 类 型 的 指针 ， 但 是 ， 如 来 该 
指针 指向 的 对 象 不 满足 一 定 的 存储 对 齐 要 求 ， 则 结果 指针 可 能 会 导致 
地 址 异常 。 指 癌 菏 对 象 的 指针 可 以 转换 为 一 个 指向 具有 更 小 或 相同 存 
储 对 齐 限制 的 对 象 的 指针 ， 并 可 以 保证 原封 不 动 地 再 转换 回来 。 


"对 齐 " 的 概念 依赖 于 具体 的 实现 ， 但 char 类 型 的 对 象 具 有 最 小 的 对 齐 
限制 。 我 们 将 在 A.6.8 


re ere yea ae 


一 个 指针 可 以 转换 为 同类 型 的 另 一 个 指针 ， 但 增加 或 删除 了 指针 所 指 
的 对 象 类 型 的 限定 符 (参见 A.4.4 节 和 A.8.2 节 ) 的 情况 除外 。 如 果 增 加 
了 限定 符 ， 则 新 指针 与 原 指 针 等 价 ， 不 同 的 是 增加 了 限定 符 带 来 的 限 
i AE RRS AS UBT RY i REGS ei AT 的 限定 
符 的 限制 。 


最 后 ， 指 向 一 个 画 数 的 指针 可 以 转换 为 指 疝 男 一 个 函数 的 指针 。 调 用 
转换 后 指针 所 指 的 函数 的 结 有 果 依 赖 于 具体 的 实现 。 但 是 ， 如 采 转 换 后 
的 指针 被 重 狐 转换 为 原来 的 类 型 ， 则 结 采 与 原来 的 指针 一 致 。 


A.6.7 void 


void 对 象 的 (不 存在 的 ) 值 不 能 够 以 任何 方式 使 用 ， 也 不 能 被 显 式 或 隐 
式 地 转换 为 任 一 非 空 类 型 。 因 为 空 (void) 表 达 式 表示 一 个 不 存在 的 
值 ， 这 样 的 表达 式 只 可 以 用 在 不 需要 值 的 地 方 ， 例 如 作为 一 个 表达 式 
语句 (参见 A.9.2 玉 ) 或 作为 逗号 运算 符 的 左 操作 数 (参见 A.7.18 1) ° 


可 以 通过 强制 类 型 转换 将 表达 式 转 换 为 void 类 型 。 例 如 ， 在 表达 式 语 
句 中 ， 一 个 空 的 强 制 类 型 转换 将 丢掉 函数 调用 的 返回 值 。 


说 明 :void 没有 在 本 书 的 第 1 版 中 出 现 ， 但 是 在 本 书 第 1 版 出 版 后 ， 它 
一 直 被 广泛 使 用 着 。 


A.6.8 指向 void 的 指针 


指向 任何 对 象 的 指针 都 可 以 转换 为 void * 类 型 ， 且 不 会 丢失 信息 。 如 
果 将 结 采 再 转换 为 初始 指针 类 型 ， 则 可 以 恢复 初始 指针 。 我 们 在 
A.6.6 太 中 讨论 过 ， 执 行 指针 到 指针 的 转换 时 ， 一般 需要 显 式 的 强制 
转换 ， 这 里 所 不 同 的 是 ， 指 针 可 以 被 赋值 为 void * 类 型 的 指针 ， 也 可 
以 赋值 给 void * 类 型 的 指针 ， 并 可 与 void* 类 型 的 指针 进行 比较 。 


说 明 :对 void * 指 针 的 解释 是 新 增加 的 。 以 前 ，char * 指 针 扮演 着 通用 指 
针 的 角色 。ANSI 标准 特别 允许 void * 类 型 的 指针 与 其 它 对 象 指针 在 
赋值 表达 式 和 关系 表达 式 中 混用 ， 而 对 其 它 类 型 指针 的 混用 则 要 求 进 
行 显 式 强制 类 型 转换 。 


A.7 表达 式 


本 节 中 各 主要 小 市 的 顺序 殊 代 表 了 表达 式 运 算 符 的 优先 级 ， 我 们 将 依 
次 按照 从 高 到 低 的 优先 级 介绍 。 举 个 例子 ， 按 照 这 种 关系 ，A.7.1 至 
A.7.6 中 定义 的 表达 式 可 以 用 作 加 法 运算 符 +( 参 见 A.7.7 万) 的 操作 
数 。 在 每 一 小 节 中 ， 各 个 运算 符 的 优先 级 相同 。 每 个 小 证 中 还 将 讨论 
该 入 涉及 到 的 运算 符 的 左 、 石 结合 性 。A.13 节 中 给 出 的 语法 综合 了 运 
算 符 的 优先 级 和 结 合 性 。 


运算 符 的 优先 级 和 结合 性 有 了 明确 的 规定 ， 但 是 ， 除 少数 例外 情况 外 ， 
表达 式 的 求 值 次 序 


没有 定义 ， 甚 至 茶 些 有 副作用 的 子 表达 式 也 没有 定义 。 也 吏 是 说 ， 除 
非 运算 符 的 定义 你 证 了 其 操作 数 按 某 一 特定 顺序 求 值 ， 否 则 ， 具 体 的 
实现 可 以 目 由 选择 任 一 求 值 次 序 ， 甚 至 可 以 交 换 求 值 次 序 。 但 是 ， 
e ee 方式 与 表达 式 的 语法 分 析 方 
TUE ARH ° 


说 明 : 该 规则 废除 了 原先 的 一 个 规则 ， 即 : 当 表 达 式 中 的 运算 符 在 数学 
上 满足 交换 律 和 结合 律 时 ， 可 以 对 表达 式 重 新 排序 ， 但 是 ， 在 计算 时 
可 能 会 不 满足 结合 律 。 这 个 改变 仅 影响 浮 点 数 在 接近 其 精度 限制 时 的 
计算 以 及 可 能 发 生 光 出 的 情况 。 


C 语言 没有 定义 表达 式 求 值 过 程 中 的 淤 出 、 除 法 检查 和 其 它 异 常 的 处 
理 。 大 多 数 现 有 C 语言 的 实现 在 进行 带 符号 整 型 表达 式 的 求 值 以 及 赋 
值 时 忽略 溢出 异常 ， 但 并 不 是 所 有 的 实现 都 这 么 做 。 对 除数 为 0 和 所 
有 浮 点 异常 的 处 理 ， 不 同 的 实现 采用 不 同 的 方式 ， 有 时 候 可 以 用 非 标 
准 库 函 数 进行 调整 。 

A.7.1 STER 

对 于 某 类 型 T， 如 果 某 表达 式 或 子 表达 式 的 类 型 为 “T 类 型 的 数组 "， 
则 此 表达 式 的 值 是 指向 数组 中 第 一 个 对 象 的 指针 ， 并 且 此 表达 式 的 类 
型 将 被 转换 为 "指向 TT 类 型 的 指针 "。 如 果 此 表达 式 是 一 元 运算 符 & 或 
sizeof， 则 不 会 进行 转换 。 类 似 地 ， 除 非 表 达 式 被 用 作 & 运 算 符 的 操作 
数 ， 否 则 ， 类 型 为 "返回 工 类 型 值 的 函数 "的 表达 式 将 被 转换 为 " 指 疝 返 
回 工 类 型 值 的 函数 的 指针 "类 型 。 


A72 初等 表达 式 
初等 表达 式 包 括 标识 符 、 和 常量 、 字 符 串 或 带 括 号 的 表达 式 。 


(表达 式 ) 


如 采 按 照 下 面 的 方式 对 标识 符 进 行 适当 的 声明 ， 该 标识 符 残 是 初等 
达 式 。 其 类 型 由 其 声明 指定 。 如 果 标 识 符 引 用 一 个 对 象 (参见 A.5 


税 ， 并 且 其 类 型 是 算术 美 型 “结构 、 联 合 或 指针， 那么 它 就 是 一 个 


种 量 是 初等 表达 式 ， 其 类 型 同 其 形式 有 关 。 更 详细 的 信息 ， 参 见 A.2.5 
PAST VE o 字符 串 字 面值 是 初等 表达 式 。 它 的 初始 类 型 为 ”char 
类 型 的 数组 "类 型 (对 于 宽 字 符 字 

符 串 ， 则 为 “wchar_t 类 型 的 数组 "类 型 )， 但 遵循 A.7.1 市 中 的 规则 。 
它 通 常 被 修改 为 " 指 

[=] char 类 型 (或 wchar_t 类 型 ) 的 指针 "类 型 ， 其 结果 是 指向 字符 串 中 第 
一 个 字符 的 指针 。 

某 些 初 始 化 程序 中 不 进行 这 样 的 转换 ， 详 细 信息 ， 参 见 A.8.7 广 。 


用 括号 括 起 来 的 表达 式 是 初等 表达 式 ， 它 的 类 型 和 值 与 无 括号 的 表达 
式 相同 。 此 表达 式 征 否 是 左 值 不 受 括 号 的 影响 。 


A.7.3 后 缀 表达 式 
后 缀 表达 式 中 的 运算 符 
后 级 表达 式 : 


初等 表达 式 后 级 表达 式 [ 表 达 式 ] 后 级 表达 式 ( 参 数 表 达 式 表 ,,) 后 级 表 
达 式 .标识 符 后 级 表达 式 。> 标 识 符 后 级 表达 式 ++ 后 缴 表 达 式 … 


参数 表达 式 表 : 赋值 表达 式 
参数 表达 式 表 , 赋值 表达 式 


1 数组 引用 市 下 标的 数组 引用 后 绥 表 达 式 由 一 个 后 缀 表达 式 后 跟 一 个 
括 在 方 括 号 中 的 表达 式 组 成 。 

方 括号 前 的 后 缀 表达 式 的 类 型 必须 为 "指向 T RAFT", AT 
某 种 类 型 ; 方 括号 中 表 


达 式 的 类 型 必须 为 整 型 。 结 果 得 到 下 标 表 达 式 的 类 型 为 T。 表 达 式 
E1[E2] 在 定义 上 等 同 于 


*((E1) + (E2))。 有 天 数组 引用 的 更 多 讨论 ， 参 见 A.8.6。 

2 函数 调用 

函数 调用 由 一 个 后 级 表达 式 ( 称 为 函数 标志 符 ，function designator) AFR 
由 圆 括号 括 起 来 的 赋值 表达 式 列表 组 成 ， 其 中 的 赋值 表达 式 列 表 可 能 
为 空 ， 并 由 喜 号 进行 分 隔 ， 这 些 表 达 式 就 是 函数 的 参数 。 如 果 后 级 表 
达 式 包含 一 个 当前 作用 域 中 不 存在 的 标识 符 ， 则 此 标识 符 将 被 隐 式 地 
声明 ， 等 同 于 在 执行 此 函数 调用 的 最 内 层 程 序 块 中 包含 下 列 声明 : 


extern int 标识 符 () 


该 后 级 表达 式 (在 可 能 的 隐 式 声明 和 指针 生成 之 后 ， 参 见 A.7.1 节 ) 的 类 
型 必须 为 "指向 返回 


三 


循 从 左 到 右 的 结合 规则 。 


D 
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说 明 : 在 第 IRP, ARAL A KAURA, AE, E HKA 
的 指针 调用 函数 时 必须 有 一 个 显 式 的 * 运 算 人 牺 。ANSI 标准 允许 现 有 的 
一 些 编译 器 用 同样 的 语法 进行 贸 数 调 用 和 通过 指向 函数 的 指针 进行 琅 
数 调用 。 旧 的 语法 仍然 有 效 。 


通常 用 术语 "实际 参数 "表示 传递 给 范 数 调用 的 表达 式 ， 而 术语 "形式 参 
数 " 则 用 来 表 示 画 数 定义 或 画 数 声明 中 的 输入 对 和 象 (或 标识 从 )。 


在 调用 芳 数 之 前 ， 芳 数 的 每 个 实际 参数 将 被 复制 ， 所 有 的 实际 参数 应 
TEHUIZEN IE ° K 数 可 能 会 修改 形式 参数 对 象 的 值 ( 即 实际 参数 表达 
式 的 副本 )， 但 这 个 修改 不 会 影响 实际 参数 的 值 。 但 是 ， 可 以 将 指针 
作为 实际 参数 传递 ， 这 样 ， 画 数 便 可 以 修改 指针 指 回 的 对 象 的 值 。 


可 以 通过 两 种 方式 声明 函数 。 在 新 的 声明 方式 中 ， 形 式 参数 的 类 型 是 
显 式 声明 的 ， 并 且 是 函数 类 型 的 一 部 分 ， 这 种 声明 称 为 函数 原型 。 在 
上 日 的 方式 中 ， 不 指定 形式 参数 类 型 。 有 关 函数 声明 的 讨论 ， 参 见 
A.8.6 节 和 A.10.1 节 。 


FERN Va AVE A, WR ERE DIA SURE, WFR LR 
式 对 每 个 实际 参数 进行 默认 参数 据 升 :对 每 个 整 型 参数 进行 整 型 提升 
(参见 A.6.1 IREA float 类 型 的 参 数 转换 为 double 类 型 。 如 采 调 
用 时 实际 参数 的 数目 与 函数 定义 中 形式 参数 的 数目 不 等 ， 或 者 某 个 实 
际 参数 的 类 型 提升 后 与 相应 的 形式 参数 类 型 不 一 人 怪 ， 则 函数 调用 的 结 
REREH o 类 型 一 致 性 依赖 于 函数 是 以 新 式 方式 定义 的 还 是 以 旧 
式 方式 定义 的 。 如 采 是 旧式 的 定义 ， 则 比较 经 提升 后 钞 数 调用 中 的 实 
际 参数 类 型 和 提升 后 的 形式 参数 类 型 ;如 末 十 新 式 的 定义 ， 则 提升 后 的 
实际 参数 类 型 必须 与 没有 提升 的 形式 参数 目 身 的 类 型 保持 一 致 。 


在 函数 调用 的 作用 域 中 ， 如 采 男 数 是 以 痢 式 方式 声明 的 ， 则 实际 参数 
将 被 转换 为 函数 原 型 中 的 相应 形式 参数 类 型 ， 这 个 过 程 类 似 于 赋值 。 
实际 参数 数目 必须 与 显 式 声明 的 形式 参数 数目 相同 ， 除 非 函数 声明 的 
形式 参数 表 以 省 略 号 (，.…) 结 尾 。 在 这 种 情况 下 ， 实 际 参 数 的 数目 必须 
等 于 或 超过 形式 参数 的 数目 ;对 于 尾部 没有 显 式 指定 类 型 的 形式 参数 ， 
相应 的 实 际 参数 要 进行 默认 的 参数 提升 ， 提 升 方法 同 前 面 所 述 。 如 采 
Me IAA TEMA, BA, 函数 原型 中 每 个 形式 参数 的 类 型 必 
须 与 画 数 定义 中 相应 的 形式 参数 类 型 一 怪 ( 画 数 定义 中 的 形式 参数 类 
型 经 过 参数 提升 后 ) 。 


说 明 : 这 些 规 则 非常 复杂 ， 因 为 必须 要 考虑 新 旧式 函数 的 混合 使 用 。 应 
尽 可 能 避免 新 旧 式 函 数 声 明 混 合 使 用 。 


实际 参数 的 求 值 次 序 没 有 指定 。 不 同 编译 右 的 实现 方式 各 不 相同 。 但 
是 ， 在 进入 函数 前 ， 实际 参数 和 男 数 标志 符 古 完全 求 值 的 ， 包 括 所 有 
的 副作用 。 对 任何 函数 都 允许 进行 递归 调用 。 


3 结构 引用 后 组 表达 式 后 跟 一 个 圆 点 和 一 个 标识 符 仍 是 后 绥 表 达 式 。 
第 一 个 操作 数 表 达 式 的 类 型 必 


须 生 结构 或 联合 ， 标 识 符 必 须 是 结构 或 联合 的 成 员 的 名 字 。 结 果 值 是 
结构 或 联合 中 命名 的 成 


员 ， 其 类 型 是 对 应 成 员 的 类 型 。 如 采 第 一 个 表达 却 是 一 个 左 值 ， 并 且 
第 二 个 表达 式 的 类 型 不 十 数 组 类 型 ， 则 整个 表达 式 古 一 个 左 值 。 


后 级 表达 式 后 跟 一 个 箭头 (由 和 > 组 成 ) 和 一 个 标识 符 仍 是 后 级 表达 
式 。 第 一 个 操作 数 表达 式 必 须 是 一 个 指向 结构 或 联合 的 指针 ， 标 识 符 
必须 是 结构 或 联合 的 成 员 的 名 字 。 结 果 指 向 指针 表达 式 指向 的 结构 或 
联合 中 命名 的 成 员 ， 结 果 类 型 是 对 应 成 员 的 类 型 。 如 果 该 类 型 不 是 数 
组 类 型 ， 则 结果 是 一 个 左 值 。 

因此 ， 表 达 式 E1*->MOS 与 (*E1).MOS 等 价 。 结 构 和 联合 将 在 A.8.3 节 
中 讨论 。 说 明 : 在 本 书 的 第 1 版 中 ， 规 定 了 这 种 表达 式 中 成 员 的 名 字 
必须 属于 后 级 表达 式 指定 的 


结构 或 联合 ， 但 是 ， 该 规则 并 没有 强制 执行 。 节 新 的 编译 做 和 ANSI 
标准 强制 执行 了 这 一 规则 o 


4 后 绥 目 增 运算 符 与 后 绥 目 城 运算 符 后 缀 表达 式 后 跟 一 个 ++ 或 "运算 
符 仍 是 一 个 后 缀 表达 式 。 表 达 式 的 值 束 十 操作 数 的 值 。 


执行 完 该 表达 式 后 ， 操 作 数 的 值 将 加 1(++) 或 减 1(…)。 操 作 数 必须 是 
一 个 左 值 。 有 关 操 


作 数 的 限制 和 运算 细节 的 详细 信息 ， 参 见 加 法 类 运算 符 (A.7.7 市 ) 和 赋 
值 类 运算 从 (A.7.17 


节 ) 中 的 讨论 。 其 结果 不 是 左 值 。 
A.7.4 一 元 运算 符 
带 一 元 运算 符 的 表达 式 遵循 从 右 到 左 的 结合 性 。 


SERAN 

后 级 表达 式 

+4+— FERIA 

“… 一 元 表达 式 

一 元 运算 符 强制 类 型 转换 表达 式 
sizeoff 一 元 表达 式 
sizeof( 类 型 名 ) 

一 元 运算 符 :one of 

&*+e~! 


1 前缀 自 增 运 算 符 与 前 缀 自 减 运算 符 在 一 元 表达 式 的 前 面 添加 运算 符 
++ 或 “后 得 到 的 表达 式 是 一 个 一 元 表达 式 。 操 作 数 将 被 


加 1(++) 或 减 1(…)， 表 达 式 的 值 是 经 过 加 1、 减 1 以 后 的 值 。 操 作 数 必 


须 是 一 个 左 值 


有 关 操 作 数 的 限制 和 运算 细节 的 详细 信息 ， 参 见 加 法 类 运算 符 ( 参 见 
A.7.7 节 ) 和 赋值 类 运算 


符 ( 参 见 A.7.17 T) ° eGR EEE ° 


2 地 址 运算 符 一 元 运算 符 & 用 于 取 操 作 数 的 地 址 。 该 操作 数 必须 是 一 
个 左 值 (不 指向 位 字段 、 不 指向 声 


明 为 register 类 型 的 对 象 )， 或 者 为 画 数 类 型 。 结 果 值 是 一 个 指针 ， 指 
向 左 值 指向 的 对 象 或 


畏 数 。 如 采 操 作 数 的 类 型 为 T， 则 绪 果 的 类 型 为 指 癌 了 类 型 的 指针 。 


3 间接 寻 址 运算 符 一 元 运算 符 * 表 示 间 接 寻 址 ， 它 返回 其 操作 数 指 加 的 
对 象 或 函数 。 如 采 它 的 操作 数 是 一 个 


旨 针 且 指 加 的 对 象 是 算术 、 结 构 、 联 合 或 指针 类 型 ， 则 它 是 一 个 左 
值 。 如 采 表 达 式 的 类 型 为 


"JEH T REHE", MERREN T ° 


4 一 元 加 运算 符 一 元 运算 符 + 的 操作 数 必须 是 算术 类 型 ， 其 结果 坪 操 
作 数 的 值 。 如 有 果 操 作 数 是 整 型 ， 则 将 


进行 整 型 提升 ， 结 果 类 型 是 经 过 提升 后 的 操作 数 的 类 型 。 


说 明 :一 元 运算 符 + 是 ANSI 标准 新 增加 的 ， 增 加 该 运算 符 是 为 了 与 一 
元 运算 符 .对 应 。5 一 元 减 运算 符 一 元 运算 符 .的 操作 数 必须 是 算术 类 
型 ， 结 果 为 操作 数 的 负 值 。 如 果 操 作 数 是 整 型 ， 则 将 


进行 整 型 提升 。 带 符号 数 的 负 值 的 计算 方法 为 :将 提升 后 得 到 的 类 型 能 
够 表示 的 最 大 值 减 去 


提升 后 的 操作 数 的 值 ， 然 后 加 1; 但 0 的 负 值 仍 为 0。 结 果 类 型 为 提升 
后 的 操作 数 的 类 型 。 


6 二 进 制 反 码 运算 符 一 元 运算 符 ~ 的 操作 数 必须 是 整 型 ， 结 采 为 操作 
数 的 二 进 制 反 码 。 在 运算 过 程 中 需要 对 操 


作 数 进行 整 型 提升 。 如 果 操 作 数 为 无 符号 类 型 ， 则 结 末 为 提升 后 的 类 
型 能 够 表示 的 最 大 值 减 


去 操作 数 的 值 而 得 到 的 结果 值 。 如 果 操作 数 为 带 符号 类 型 ， 则 结果 的 
计算 方式 为 :将 提升 后 的 操作 数 转换 为 相应 的 无 符号 类 型 ， 使 用 运算 符 

-计算 友 码 ， 再 将 结果 续 换 为 带 答 号 关 型 。 结 果 的 关 型 为 提升 后 的 扣 
数 的 类 型 。 


7 逻辑 非 运 算 符 


运算 从! 的 操作 数 必 须 是 算术 类 型 或 者 指针 。 如 果 操 作 数 等 于 0， 则 结 
果 为 1， 否 则 结果 为 0。 结果 类 型 为 int ° 

8 sizeof 运算 符 

sizeof BF 1 Fa SS PRE RUA] RT RP TT oo BRE 
数 可 以 为 一 个 未 求 值 的 表达 式 ， 也 可 以 为 一 个 用 括号 括 起 来 的 类 型 

名 。 将 sizeof 应 用 于 char 类 型 时 ， 其 结 果 值 为 1; 将 它 应 用 于 数组 时 ， 
其 值 为 数组 中 字 厄 的 总 数 。 应 用 于 结构 或 联合 时 ， 结 果 为 对 象 NS 
数 ， 包 括 对 象 中 包含 的 数组 所 需要 的 任何 填充 空间 :有 nm 个 元 素 的 数组 
的 长 度 是 一 个 数组 元 素 长 度 的 n 倍 。 此 运算 符 不 能 用 于 函数 类 型 和 不 
完整 类 型 的 操作 数 ， 也 不 能 用 于 位 字 段 。 结 果 是 一 个 无 符号 整 型 常 

量 ， 具 体 的 类 型 由 实现 定义 。 在 标准 头 文件 <stddef.h>( 参 ILIK B) 

中 ， 这 一 类 型 被 定义 为 Size t 类 型 。 

A.7.5 强制 类 型 转换 


以 括号 括 起 来 的 类 型 名 开头 的 一 元 表达 了 式 将 导致 表达 式 的 值 被 转换 为 
指定 的 类 型 。 


强制 类 型 转换 表达 式 : 一 元 表达 式 (类 型 名 ) 强 制 类 型 转换 表达 式 


这 种 结构 称 为 强制 类 型 转换 。 类 型 名 将 在 A.8.8 THN o RAAR 
已 在 A.6 节 讨 论 过 。 包 含 强制 类 型 转换 的 表达 式 不 是 左 值 。 


A.7.6 乘法 类 运算 符 
乘法 类 运算 符 &、/ 和 % 遵 循 从 左 到 右 的 结合 性 。 
来 法 类 表达 式 : 强制 类 型 转换 表达 式 


来 法 类 表达 式 * 强 制 类 型 转换 表达 式 来 法 类 表达 式 /强制 类 型 转换 表达 
A 来 法 类 表达 式 % 强 制 类 型 转换 表达 式 


运算 符 * 和 /的 操作 数 必 须 为 算术 类 型 ， 运 算 符 & 的 操作 数 必须 为 整 
型 。 这 些 操作 数 需 要 进行 普通 的 算术 类 型 转换 ， 结 采 类 型 由 执行 的 转 


换 决 定 。 


二 元 运算 符 * 表 示 乘 法 。 二 元 运算 符 / 用 于 计算 第 一 个 操作 数 同 第 二 个 
操作 数 相 除 所 得 的 丙 ， 而 运算 符 % 用 于 计算 


两 个 操作 数 相 除 后 所 得 的 余数 。 如 果 第 二 个 操作 数 为 0， 则 结果 没有 
mE Se FFA, (a/b)*b+a%b 


等 于 a 永远 成 立 。 如 有 果 两 个 操作 数 均 为 非 负 ， 则 余数 为 非 负 值 且 小 于 
除数 ， 否 则 ， 仅 保证 余 


数 的 绝对 值 小 于 除数 的 绝对 值 。 


A.7.7 加 法 类 运算 符 


加 法 类 运算 符 + 和 遵循 从 左 到 右 的 结合 性 。 如 果 操 作 数 中 有 算术 类 型 
e a a ear ee age 


加 法 类 表达 式 : 来 法 类 表达 式 
加 法 类 表达 式 + 来 法 类 表达 式 加 法 类 表达 式 . 来 法 类 表达 式 


运算 符 + 用 于 计算 两 个 操作 数 的 和 。 指 向 数组 中 某 个 对 象 的 指针 可 以 
和 一 个 任何 整 型 的 值 相 加 ， 后 者 将 通过 乘 以 所 指 对 象 的 长 度 被 转换 为 
地 址 偏 移 量 。 相 加 得 到 的 和 是 一 个 指针 ， 它 与 初始 指针 具有 相同 的 类 
型 ， 并 指 疝 同一 数组 中 的 另 一 个 对 象 ， 此 对 象 与 初始 对 象 之 间 具 有 一 
定 的 偏 移 量 。 因 此 ， 如 果 P 是 一 个 指 疝 数组 中 某 个 对 象 的 指针 ， 则 表 
达 式 P+1 是 指 同 数组 中 下 一 个 对 象 的 指针 。 如 果 相 加 所 得 的 和 对 应 的 
旨 针 不 在 数组 的 范围 内 ， 且 不 是 数组 末尾 元 素 后 的 第 一 个 位 置 ， 则 结 
果 没 有 定义 。 

说 明 : 允 许 指针 指向 数 纽 末尾 元 素 的 下 一 个 元 素 是 ANSI 中 新 增加 的 特 
征 ， 它 使 得 我 们 可 以 按照 通常 的 习惯 循环 地 访问 数 纽 元 素 。 

运算 符 , 用 于 计算 两 个 操作 数 的 差 值 。 可 以 从 某 个 指针 上 减 去 一 个 任何 
整 型 的 值 ， 减 法 运 算 的 转换 规则 和 条 件 与 加 法 的 相同 。 

如 果 指 回 同 一 类 型 的 两 个 指针 相 减 ， 则 结果 是 一 个 市 符号 整 型 数 ， 表 
示 它 们 指向 的 对 象 之 间 的 偏 移 量 。 相 令 对 象 间 的 偏 移 量 为 1。 结果 的 
类 型 同 具体 的 实现 有 天， 但 在 标准 头 文件 

<stddef.h> 中 定义 为 ptrdiff t。 只 有 当 指 针 指 回 的 对 象 属于 同一 数组 
时 ， 差 值 才 有 意义 。 但 是 ， 如 果 了 指向 数组 的 最 后 一 个 元 素 ， 则 
(P+1)*P 的 值 为 1。 

A.7.8 移 位 运算 符 


移 位 运算 符 << 和 >> 遵 循 从 左 到 右 的 结合 性 。 每 个 运算 符 的 各 操作 数 都 
必须 为 整 型 ， 并 且 遵循 整 型 握 升 原则 。 结 果 的 类 型 站 提升 后 的 左 操 作 


数 的 类 型 。 如 果 右 操作 数 为 负 值 ， 或 者 大 于 或 等 于 左 操作 数 类 型 的 位 
数 ， 则 结果 没有 定义 。 

移 位 表达 式 : 
We 
工 

E1<<E2 的 值 为 E1( 按 位 模式 解释 ) 癌 左 移 E2 位 得 到 的 结果 。 如 果 不 发 
生 海 出 ， 这 个 结果 值 等 价 于 EL FEL) 2"? ° E1>>E2 WEA El ae 
E2 位 得 到 的 结果 。 如 果 E1 为 无 符号 数 或 为 非 负 值 ， 则 右 移 等 同 于 
El 除 以 2"*。 其 它 情况 下 的 执行 结果 由 具体 实现 定义 。 


A.7.9 关系 运算 符 


关系 运算 符 遵循 从 左 到 右 的 结合 性 ， 但 这 个 规则 没有 什么 作用 。a<b<c 
在 语法 分 析 时 将 


被 解释 为 (a<b)<c， 并 且 a<b 的 结果 值 只 能 为 0 或 1。 


移 位 表达 式 关系 表达 式 < 移 位 表达 式 关系 表达 式 > 移 位 表达 式 RAK 
达 式 <= 移 位 表达 式 , 关系 表 达 式 >= 移 位 表达 式 


当天 系 表达 式 的 结果 为 假 时 ， 运 算 符 <( 小 于 )、>( 大 于 )、<=( 小 于 等 于 ) 
和 >=( 大 于 等 于 ) 的 结 采 值 都 为 0; 当 关系 表达 式 的 结果 为 真 时 ， 它 们 的 
结 打 值 都 为 1。 结果 的 类 型 为 int 类 型 。 如 采 操 作 数 为 算术 类 型 ， 则 
要 进行 普通 的 算术 类 型 转换 。 可 以 对 指 癌 同一 类 型 的 对 象 的 指针 进行 
比较 (忽略 任何 限定 符 )， 其 结果 依赖 于 所 指 对 象 在 地 址 空间 中 的 相对 
位 置 。 指 针 比 较 只 对 相同 对 象 才 有 意义 :如 来 两 个 指针 指向 同一 个 简单 
对 和 象 ， 则 相等 ;如 有 果 指 针 指向 同一 个 结 构 的 不 同 成 员 ， 则 指向 结构 中 后 
声明 的 成 员 的 指针 较 大 ;如 末 指 针 指 向 同一 个 联合 的 不 同 成 员 ， 则 相 
等 ;如 末 指 针 指 癌 一 个 数组 的 不 同 成 员 ， 则 它们 之 间 的 比较 等 价 于 对 应 
下 标 之 则 的 比较 。 如 采 指 针 P 指向 数组 的 最 后 一 个 成 员 ， 尺 管 P+1 已 
指向 数组 的 界外 ,但 PH 仍 比 P 大。 其 它 情况 下 指针 的 比较 没有 定 
Yoo 


说 明 : 这 些 规则 允许 指向 同一 个 结构 或 联合 的 不 同 成 员 的 指针 之 间 进 行 
比较 ， 与 第 1 版 比较 起 来 放宽 了 一 些 限制 。 这 些 规则 还 使 得 与 超出 
数 纽 末尾 的 第 一 个 指针 进行 比较 合法 化 。 

A.7.10 相等 类 运算 符 

相等 类 表达 式 : 关系 表达 式 

相等 类 表达 式 == 关 系 表 达 式 相等 类 表达 式 != 关 系 表 达 式 


运算 符 ==( 等 于 ) 和 1!=( 不 等 于 ) 与 天 系 运算 符 相 似 ， 但 它们 的 优先 级 更 
低 。( 只 要 axb 


与 c<d 具有 相同 的 真 值 ， 则 a<b==c<d 的 值 总 为 1。) 
相等 类 运算 符 与 关系 运算 符 具 有 相同 的 规则 ， 但 这 类 运算 符 还 允许 执 


行 下 列 比较 :指针 可 以 与 值 为 0 的 常量 整 型 表达 式 或 指向 void 的 指针 
进行 比较 。 参 见 A.6.6 T° 


A.7.11 按 位 与 运算 符 
按 位 与 表达 式 : 相等 类 表达 式 
按 位 与 表达 式 & 相等 类 表达 式 


执行 按 位 与 运算 时 要 进行 普通 的 算术 类 型 转换 。 结 有 果 为 操作 数 经 按 位 
与 运算 后 得 到 的 值 。 该 运算 符 仅 适 用 于 整 型 操作 数 。 


A.7.12 按 位 异 或 运算 符 
按 位 异 或 表达 式 : 按 位 与 表达 式 
按 位 异 或 表达 式 ^ 按 位 与 表达 式 


执行 按 位 异 或 运算 时 要 进行 普通 的 算术 类 型 转换 ， 结 果 为 操作 数 经 按 
位 异 或 运算 后 得 到 的 值 。 该 运算 符 仅 适用 于 整 型 操作 数 。 


A.7.13 按 位 或 运算 符 
按 位 或 表达 式 : 按 位 异 或 表达 式 
按 位 或 表达 式 | 按 位 异 或 表达 式 


执行 按 位 或 运算 时 要 进行 常规 的 算术 类 型 转换 ， 结 果 为 操作 数 经 按 位 
或 运算 后 得 到 的 值 。 该 运算 符 仅 适用 于 整 型 操作 数 。 

A.7.14 逻辑 与 运算 符 

逻辑 与 表达 式 : 按 位 或 表达 式 

逻辑 与 表达 式 && 按 位 或 表达 式 

运算 符 && 遵 循 从 左 到 右 的 结合 性 。 如 果 两 个 操作 数 都 不 等 于 0， 则 结 
果 值 为 1， 否 则 结果 值 0。 与 运算 符 & 不 同 的 是 ，&& 人 确保 从 左 到 右 的 
求 值 次 序 :首先 计算 第 一 个 操作 数 ， 包 括 所 有 可 能 的 副作用 ;如 果 为 

0， 则 整个 表达 式 的 值 为 0; 否 则 ， 计 算 右 操作 数 ， 如 果 为 0， 则 整个 表 
AR 的 值 为 0， 否 则 为 1。 


两 个 操作 数 不 需要 为 同一 类 型 ， 但 是 ， 每 个 操作 数 必须 为 算术 类 型 或 
者 指针 。 其 结果 为 


int 类 型 。 
A.7.15 逻辑 或 运算 符 


逻辑 或 表达 式 : 逻辑 与 表达 式 


逻辑 或 表达 式 | 逻辑 与 表达 式 


运算 符 | 遵 循 从 左 到 右 的 结合 性 。 如 采 该 运算 符 的 某 个 操作 数 不 为 0， 
MAREN 1; 否 则 结 果 值 为 0。 与 运算 符 | 不 同 的 是 ，|| 确 保 从 左 到 右 
的 求 值 次 序 :首先 计算 第 一 个 操作 数 ， 包 括 所 有 可 能 的 副作用 ;如 采 不 
为 0， 则 整个 表达 式 的 值 为 1; 人 否则， 计算 右 操作 数 ， 如 果 不 为 0， 则 
整个 表达 式 的 值 为 1; 否 则 结果 为 ° 


两 个 操作 数 不 需要 为 同一 类 型 ， 但 是 每 个 操作 数 必须 为 算术 类 型 或 者 
指针 。 其 结果 为 int 


类 型 。 

A.7.16 条 件 运 算 符 

条 件 表达 式 : 

逻辑 或 表达 式 逻辑 或 表达 式 ? 表 达 式 :条 件 表达 式 

首先 计算 第 一 个 表达 式 ( 包 括 所 有 可 能 的 副作用 )， 如 果 该 表达 式 的 值 
不 等 于 0， 则 结果 为 第 二 个 表达 式 的 值 ， 否 则 结果 为 第 三 个 表达 式 的 
值 。 第 二 个 和 第 三 个 操作 数 中 仅 有 一 个 操作 数 会 被 计算 。 如 果 第 二 个 
和 第 三 个 操作 数 为 算术 类 型 ， 则 要 进行 普通 的 算术 类 型 转换 ， 以 使 它 
们 的 类 型 相同 ， 该 类 型 也 是 结果 的 类 型 。 如 果 它 们 都 是 void 类 型 ， 或 
者 是 同一 类 型 的 结构 或 联合， 或 者 是 指向 同一 类 型 的 对 象 的 指针 ， 则 
结果 的 类 型 与 这 两 个 操作 数 的 类 型 相同 。 如 果 其 中 一 个 操作 数 是 指 

针 ， 而 另 一 个 是 常量 0， 则 0 将 被 转换 为 指针 类 型 ， 且 结果 为 指针 类 
型 。 如 果 一 个 操作 数 为 指向 void 的 指针 ， 而 另 一 个 操作 数 为 指向 其 它 
类 型 的 指针 ， 则 指向 其 它 类 型 的 指针 将 被 转换 为 指向 void 的 指针 ， 这 
也 是 结果 的 类 型 。 

在 比较 指针 的 类 型 时 ， 指 针 所 指 对 象 的 类 型 的 任何 类 型 限定 符 ( 参 见 

A.8.2 节 ) 都 将 被 忽略 ， 但 结果 类 型 会 继承 条 件 的 各 分 支 的 限定 符 。 


A.7.17 赋值 表达 式 

赋值 运算 待 有 多 个 ， 它 们 都 是 从 左 到 右 结 合 。 

赋值 表达 式 : 

PRAT 

一 元 表达 式 赋值 运算 符 赋值 表达 式 赋值 运算 符 :one of 

== /= B= $= o= <<a >= W= A= I= 

所 有 这 些 运 算 符 都 要 求 左 操作 数 为 左 值 ， 且 该 左 值 是 可 以 修改 的 : 它 不 


可 以 是 数组 、 不 完整 类 型 或 画 数 。 同 时 其 类 型 不 能 包括 const 限定 符 ; 
如 果 它 是 结构 或 联合 ， 则 它 的 任意 一 个 成 员 或 递归 子 成 员 不 能 包括 


const 限定 符 。 赋 值 表达 式 的 类 型 是 其 左 操作 数 的 类 型 ， 值 是 赋值 操 
作 执 行 后 存储 在 左 操 作 数 中 的 值 。 


在 使 用 运算 符 = 的 简单 赋值 中 ， 表 达 式 的 值 将 蔡 换 左 值 所 指 癌 的 对 和 象 
的 值 。 下 面 几 个 条 件 中 必须 有 一 个 条 件 成 立 :两 个 操作 数 均 为 算术 类 
型 ， 在 此 情况 下 右 操作 数 的 类 型 通过 赋值 转 换 为 左 操作 数 的 类 型 ;两 个 
操作 数 为 同一 类 型 的 结构 或 联合 ;一 个 操作 数 是 指针 ， 必 一 个 操 作 数 是 
tale] void 的 指针 ; 左 操 作 数 是 指针 ， 石 操作 数 是 值 为 0 的 常量 表达 陈 ; 
两 个 操作 数 都 是 指 加 同一 类 型 的 函数 或 对 象 的 指针 ， 但 右 操作 数 可 以 


P2 br 


没有 const 或 volatile 限定 符 。 


形式 为 El op= E2 的 表达 式 等 价 于 El = El op (E2)， 惟 一 的 区 别 是 前 
者 对 El 仅 求 值 一 次 。 


FIAT: 

赋值 表达 式 

表达 式 , 赋值 表达 式 

由 去 号 分 隔 的 两 个 表达 式 的 求 值 次 序 为 从 左 到 在， 并 且 左 表达 式 的 值 
BEF ° AREAK 型 和 值 就 是 结果 的 类 型 和 值 。 在 开始 计算 右 探 
作 数 以 前 ， 将 完成 左 操 作 数 涉及 到 的 副作用 的 计算 。 在 逗号 有 特别 舍 
义 的 上 下 文中 ， 如 在 函数 参数 表 ( 参 见 A.7.3 市 ) 和 初 值 列表 (A.8.7 T) 
中 ， 需 要 使 用 赋值 表达 式 作 为 语法 单元 ， 这 样 ， 喜 号 运算 符 仅 出 现在 
加 括号 中 。 例 如 ， 下 列 函 数 调 用 : 


f(a, (t=3, t+2), c) 

包含 3 个 参数 ， 其 中 第 二 个 参数 的 值 为 5。 

A.7.19 TEKAN 

从 语法 上 看 ， 和 常量 表达 式 是 限定 于 运算 符 的 某 一 个 子 集 的 表达 式 : 
TERAN: 

条 件 表达 式 

某 些 上 下 文 要 求 表 达 式 的 值 为 常量 ， 例 如 ，switch 语句 中 case 后 面 的 
数值 、 数 组 边界 和 位 字段 的 长 度 、 枚 举 常 量 的 值 、 初 值 以 及 某 些 预 处 
理 需 表达 式 。 

除了 作为 sizeof 的 操作 数 之 外 ， 第 量 表达 式 中 可 以 不 包含 赋值 、 目 增 
KAWSAR O KAANE SARN o WREKE EKAN 
型 ， 则 它 的 操作 数 必 须 由 整 型 、 枚 举 、 字 符 和 浮 点 第 量 组 成 ;强制 类 型 
转换 必须 指定 为 整 型 ， 任 何 浮 点 常量 都 将 被 强制 转换 为 整 型 。 此 规则 


对 数组 、 间 接 访 问 、 取 地 址 运算 符 和 结构 成 员 操 作 不 运用 。( 但 是 ， 
sizeof 可 以 市 任何 类 型 的 操作 数 。) 


AEP AY Hy ERIAN ICE RAE H: PREE De Ee eA A a E, 
一 元 运算 符 & 可 以 MEHTAR PAT RL A ERAN PARE 
外 部 或 鹏 态 数 组 。 对 于 无 下 标的 数组 或 画 数 的 情况 ， 一 元 运算 符 & 将 
被 隐 式 地 应 用 。 初 值 计算 的 结果 值 必 须 为 下 列 二 者 之 一 :一 个 常量 ; 前 
面 声明 的 外 部 或 静态 对 象 的 地 址 加 上 或 减 去 一 个 常量 。 


允许 出 现在 #f 后 面 的 整 型 种 量 表达 式 的 范围 较 小 ， 它 不 允许 sizeof 表 
达 式 、 枚 举 常 量 和 强制 类 型 转换 。 详 细 信 息 参 见 A.12.5 T° 


A.8 声明 

声明 (declaration) 用 于 说 明 每 个 标识 符 的 含义 ， 而 并 不 需要 为 每 个 标识 
oe 。 预 留存 储 空 间 的 声明 称 为 定义 (definitiomn)。 声 明 的 
ra FB: 


声明 


声明 说 明 符 初始 化 声明 符 表 opt; 


初始 化 声明 符 表 中 的 声明 符 包 含 被 声明 的 标识 符 ; 声 明说 明 符 由 一 系列 
的 类 型 和 存储 类 说 明 符 组 成 。 


声明 说 明 符 : 


存储 类 说 明 符 声明 说 明 符 opt 类 型 说 明 符 声明 说 明 符 opt 类 型 限定 符 
声明 说 明 符 opt 


初 姑 化 声明 符 表 : 初始 化 声明 符 

初 姑 化 声明 符 袁 ， 初 始 化 声明 符 初始 化 声明 符 : 

声明 符 

声明 符 = 初 值 

声明 符 将 在 稍 后 部 分 讨论 (参见 A.8.5 节 )。 声 明 符 包 含 了 被 声明 的 名 
字 。 一 个 声明 中 必须 至 少 包含 一 个 声明 符 ， 或 者 其 类 型 说 明 符 必须 声 
明 一 个 结构 标记 、 一 个 联合 标记 或 枚 举 的 成员。 不 允许 空 声明 。 
A.8.1 存储 类 说 明 符 

存储 类 说 明 符 如 下 所 示 : 存储 类 说 明 符 : 


auto register static extern typedef 
有 关 存 储 类 的 意义 ， 我 们 已 在 A.4 市 中 讨论 过 。 


说 明 符 auto 和 register 将 声明 的 对 象 说 明 为 目 动 存储 类 对 象 ， 这 些 对 
象 仅 可 用 在 函 数 中 。 这 种 声明 也 具有 定义 的 作用 ， 并 将 预 留存 储 空 
间 。 带 有 register 说 明 符 的 声明 等 价 于 带 有 auto 说 明 符 的 声明 ， 所 不 
同 的 是 ， 前 者 暗示 了 声明 的 对 象 将 被 频 索 地 访问 。 只 有 很 少 的 对 象 被 
真正 存放 在 寄存 器 中 ， 并 且 只 有 特定 类 型 才 可 以 。 该 限制 同 具体 的 实 
现 有 关 。 但 是 ， 如 果 一 个 对 象 被 声明 为 register， 则 将 不 能 对 它 应 用 
一 元 运算 和 从 &( 显 式 应 用 或 隐 式 应 用 都 不 允许 )。 


说 明 :对 声明 为 register 但 实际 按照 auto 类 型 处 理 的 对 象 的 地 址 进行 计 
算是 非法 的 。 这 是 一 个 新 增加 的 规则 。 


说 明 符 static 将 声明 的 对 象 说 明 为 静 仿 存储 类 。 这 种 对 象 可 以 用 在 画 
数 内 部 或 函数 外 部 。 在 函数 内 部 ， 该 说 明 符 将 引起 存储 空间 的 分 配 ， 
具有 定义 的 作用 。 有 关 该 说 明 符 在 函数 外 部 的 作用 参见 A.11.2 市 。 


函数 内 部 的 extern 声明 表明 ， 被 声明 的 对 象 的 存储 空间 定义 在 其 它 地 
方 。 有 关 该 说 明 符 在 函数 外 部 的 作用 参见 A.11.2 7 ° 

typedef 说 明 符 并 不 会 为 对 象 预 留存 储 空 间 。 之 所 以 将 它 称 为 存储 类 说 
明 符 ， 是 为 了 语 法 描述 上 的 方便 。 我 们 将 在 A.8.9 和 中 讨论 它 。 

一 个 声明 中 最 多 只 能 有 一 个 存储 类 说 明 符 。 如 果 没 有 指定 存储 类 说 明 
符 ， 则 将 按照 下 列 规则 进行 :在 函数 内 部 声明 的 对 象 被 认为 是 auto 类 
型 ;在 函数 内 部 声明 的 函数 被 认为 是 extern 类 型 ;在 函数 外 部 声明 的 对 
象 与 函数 将 被 认为 是 static 类 型 ， 且 具有 外 部 连接 。 详 细 信 息 参见 
A.10 TM A.11 Ë ° 


A.8.2 类 型 说 明 符 


类 型 说 明 符 的 定义 如 下 : 类 型 说 明 符 : 


void char short int long float double signed 


unsigned 
结构 或 联合 说 明 符 枚 举 说 明 符 类 型 定义 名 


其 中 ，long 和 short 这 两 个 类 型 说 明 符 中 最 多 有 一 个 可 同时 与 int 一 起 
使 用 ， 并 且 ， 在 这 种 情况 下 省 略 天 键 字 int 的 含义 也 是 一 样 的 。long 
可 与 double 一 起 使 用 。signed 和 unsigned 这 两 个 类 型 说 明 符 中 最 多 有 
一 个 可 同时 与 int ` int 的 short 或 long 形式 、char 一 起 使 用 。signed 和 
unsigned 可 以 单独 使 用 ， 这 种 情况 下 默认 为 int 类 型 。signed 说 明 符 对 
于 强制 char 对 象 带 符号 位 是 非常 有 用 的 ;其 它 整 型 也 人 允许 市 signed 声 
明 ， 但 这 是 
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除了 上 面 这 些 情况 之 外 ， 在 一 个 声明 中 最 多 只 能 使 用 一 个 类 型 说 明 
符 。 如 果 声 明 中 没有 类 型 说 明 符 ， 则 默认 为 int 类 型 。 


类 型 也 可 以 用 限定 符 限 定 ， 以 指定 被 声明 对 象 的 特殊 属性 。 类 型 限定 
符 : 


const volatile 


类 型 限定 符 可 与 任何 类 型 说 明 符 一 起 使 用 。 可 以 对 const 对 象 进行 初 
人 化， 但 在 初始 化 


以 后 不 能 进行 赋值 。volatile 对 象 没 有 与 实现 无 天 的 语义 。 

说 明 :const 和 volatile 属性 是 ANSI 标准 新 增加 的 特性 。const 用 于 声明 
可 以 存放 在 只 读 存 储 器 中 的 对 象 ， 并 可 能 提高 优化 的 可 能 性 。volatile 
用 于 强制 某 个 实现 屏蔽 可 能 的 优化 。 倒 如 ， 对 于 具有 内 存 映 像 输入 / 输 
出 的 机 絮 ， 指 同 设备 寄存 妖 的 指针 可 以 声明 为 指 [A] volatile 的 指针 ， 

目的 是 防止 编译 器 通过 指针 删除 明显 多 余 的 引用 。 除 了 诊断 显 式 和 芝 试 
修改 const 对 象 的 情况 外 ， 编 译 恬 可 能 会 忽略 这 些 限定 符 。 

A.8.3 结构 和 联合 声明 

结构 是 由 不 同类 型 的 命名 成 员 序 列 组 成 的 对 象 。 联 合 也 是 对 象 ， 在 不 
同时 刻 ， 它 包含 多 个 不 同类 型 成 员 中 的 任意 一 个 成 员 。 结 构 和 联合 说 
明 符 具有 相同 的 形式 。 

结构 或 联合 说 明 符 : 

结构 或 联合 标识 符 opt {结构 声明 表 } 

结构 或 联合 标识 符 


结构 或 联合 : 


struct union 


结构 声明 表 是 对 结构 或 联合 的 成 员 进行 声明 的 声明 序列 
结构 声明 表 

结构 声明 

结构 声明 表 结构 声明 结构 声明 

说 明 符 限定 符 表 结构 声明 符 表 说 明 符 限 定 符 表 : 


类 型 说 明 符 说 明 符 限定 符 表 opt 
类 型 限定 符 说 明 符 限定 符 表 opt 
结构 声明 符 表 : 结构 声明 符 


结构 声明 符 表 , 结构 声明 符 通常 ， 结 构 声明 符 就 是 结构 或 联合 成 员 的 
声明 符 。 结 构成 员 也 可 能 由 指定 数目 的 比特 位 组 成 ， 


这 种 成 员 称 为 位 字段 ， 或 仅 称 为 字段 ， 其 长 度 由 跟 在 声明 符 冒 号 之 后 
的 常量 表达 式 指定 。 


结构 声明 符 : 
声明 符 


声明 符 opt: 常量 表达 式 下 列 形式 的 类 型 说 明 符 将 其 中 的 标识 符 声 明 为 
人 
} 


在 同一 作用 域 或 内 层 作用 域 中 的 后 续 声 明 中 ， 可 以 在 说 明 符 中 使 用 标 
记 (而 不 使 用 结构 声明 表 ) 来 引用 同一 类 型 ， 如 下 所 示 : 


结构 或 联合 标识 符 如 宁 说 明 符 中 只 有 标记 而 无 结构 声明 表 ， 并 且 标 记 
没有 声明 ， 则 认为 真 为 不 完整 类 型 。 具 有 


不 完整 结构 或 联合 类 型 的 对 象 可 在 不 需要 对 象 大 小 的 上 下 文中 引用 ， 
比如 ， 在 声明 中 (不 是 


定义 中 )， 它 可 用 于 说 明 一 个 指针 或 创建 一 个 typedef 类 型 ， 其 余 情况 
则 不 允许 。 在 引用 之 后 ， 如 果 具 有 该 标记 的 说 明 符 再 次 出 现 并 包含 一 
个 声明 表 ， 则 该 类 型 成 为 完整 类 型 。 即 使 是 在 包含 结构 声明 表 的 说 明 
符 中 ， 在 该 结构 声明 表 内 声明 的 结构 或 联合 类 型 也 是 不 完整 的 ， 一 直 
到 花 括 号 ” }" 终 止 该 说 明 符 时 ， 声 明 的 类 型 才 成 为 完整 类 型 。 


结构 中 不 能 包含 不 完整 类 型 的 成 员 。 因 此 ， 不 能 声明 包含 目 身 实例 的 
结构 或 联合 。 但 是 ， 除 了 可 以 命名 结构 或 联合 类 型 外 ， 标 记 还 可 以 用 


来 定义 目 引 用 结构 。 由 于 可 以 声明 指向 不 完 整 类 型 的 指针 ， 所 以 ， 结 
构 或 联合 可 包含 指 癌 目 身 实例 的 指针 。 


下 列 形式 的 声明 适用 一 个 非常 特殊 的 规则 : 结构 或 联合 标识 符 ， 


这 种 形式 的 声明 声明 了 一 个 结构 或 联合 ， 但 它 没 有 声明 表 和 声明 符 。 
即使 该 标识 符 是 外 层 作 用 域 中 已 声明 过 的 结构 标记 或 联合 的 标记 ( 参 
W A.11.1 节 )， 该 声明 仍 将 使 该 标识 符 成 为 当前 作用 域内 一 个 新 的 不 
完整 类 型 的 结构 标记 或 联合 的 标记 。 


说 明 :这 是 ANSI 中 一 个 新 的 比较 难 理解 的 规则 。 它 旨 在 处 理 内 层 作用 
a 
或 中 声明 。 


具有 结构 声明 表 而 无 标记 的 结构 说 明 符 或 联合 说 明 符 用 于 创建 一 个 惟 
一 的 类 型 ， 它 只 能 被 它 所 在 的 声明 直接 引用 。 


成 员 和 标记 的 名 字 不 会 相互 种 突 ， 也 不 会 与 普通 变量 冲突 。 一 个 成 
名 子 不 能 在 同一 结 


0 


aaa 出 现 两 次 ， 但 相同 的 成 员 名 字 可 用 在 不 同 的 结构 或 联合 


说 明 : 在 本 书 的 第 1 版 中 ， 绪 构 或 联合 的 成 员 名 与 其 父 幸 无 天 联 。 但 
Æ, Œ ANSI 标准 制定 前 ， 这 种 关联 在 编译 紫 中 普 裔 存在。 


除 字 段 类 型 的 成 员外 ， 结 构成 员 或 联合 成 员 可 以 为 任意 对 象 类 型 。 字 
段 成 员 ( 它 不 需要 声明 符 ， 因 此 可 以 不 命名 ) 的 类 型 为 int、unsigned int 
或 signed int， 并 被 解释 为 指 定 长 度 (用 二 进 制 位 表示 ) 的 整 型 对 象 ，int 
类 型 的 字段 是 否 看 作为 有 符号 数 同 具体 的 实现 有 关 。 结 构 的 相 邻 字段 
成 员 以 某 种 力 式 ( 同 具体 的 实现 有 关 ) 存 放 在 某 些 存储 单元 中 ( 同 具 体 的 
实现 有 关 )。 如 果 某 字段 之 后 的 另 一 字段 无 法 全 部 存 入 已 被 前 面 的 字段 
部 分 占用 的 存储 单 元 中 ， 则 它 可 能 会 被 分 割 存 放 到 多 个 存储 单元 中 ， 
或 者 是 ， 存 储 单 元 中 的 剩余 部 分 也 可 能 被 填充 。 我 们 可 以 用 宽度 为 0 
的 无 名 字段 来 强制 进行 这 种 填充 ， 从 而 使 得 下 一 字段 从 下 一 分 配 单元 
的 边界 开始 存储 。 


说 明 : 在 字段 处 理 方面 ，ANSI 标准 比 第 1 版 更 依赖 于 具体 的 实现 。 如 
果 要 按照 与 实现 相 天 的 方式 存储 字段 ， 建 议 阅读 一 下 该 语言 规则 。 作 
为 一 种 可 移植 的 方法 ， 带 字段 的 结构 可 用 来 节省 存储 空间 (代价 是 增 

加 了 指令 空间 和 访问 字段 的 时 间 )， 同 时 ， 它 还 可 以 用 来 在 位 层次 上 

描述 存储 布局 ， 但 该 方法 不 可 移植 ， 在 这 种 情况 下 ， 必 须 了 解 本 地 实 
现 的 一 些 规则 。 


结构 成 员 的 地 址 值 按 它 们 声明 的 顺序 递增 。 非 字段 类 型 的 结构 成 员 根 
据 其 类 型 在 地 址 边 界 上 对 齐 ， 因 此 ， 在 结构 中 可 能 存在 无 名 空余。 若 
指 问 某 一 结构 的 指针 被 强制 转换 为 指 癌 该 结构 第 一 个 成 员 的 指针 类 
型 ， 则 结果 将 指向 该 结构 的 第 一 个 成 员 。 


联合 可 以 补 看 作为 结构 ， 其 所 有 成 员 起 始 仿 移 量 都 为 0， 并 且 其 大 小 
足以 容纳 任何 成 员 。 任 一 时 刻 它 最 多 只 能 存储 其 中 的 一 个 成 员 。 如 采 
指 问 某 一 联合 的 指针 被 强制 转换 为 指 疝 一 个 成 员 的 指针 类 型 ， 则 结 
将 指向 该 成 员 。 


如 下 所 示 古 结构 声明 的 一 个 简单 例子 : 


struct tnode { char tword[20]; int count; 


struct tnode *left; struct tnode *right; 
} 


该 结构 包含 一 个 具有 20 个 字符 的 数组 、 一 个 整数 以 及 两 个 指 回 类 似 结 
构 的 指针 。 在 给 出 这 样 的 声明 后 ， 下 列 说 明 : 


struct tnode s, *sp; 


将 把 s 声明 为 给 定 类 型 的 结构 ， 把 sp 声明 为 指向 给 定 类 型 的 结构 的 指 
针 。 在 这 些 声明 的 基础 上 ， 表 达 式 


sp*>count 


引用 sp 指 同 的 结构 的 count 字段 ， 而 


s.left 
则 引用 结构 的 碟子 树 指针 ， 表 达 式 
s.righte>tword[0] 


引用 s 右 子 树 中 tword 成 员 的 第 一 个 字符 。 通常 情况 下 ， 我 们 无 法 检 
查 联 合 的 某 一 成 员 ， 除 非 已 用 该 成 员 给 联合 赋值 。 但 是 ， 有 一 


个 特殊 的 情况 可 以 简化 联合 的 使 用 :如 果 一 个 联合 包含 共享 一 个 公共 初 
始 序 列 的 多 个 结构 ， 


并 且 该 联合 当前 包含 这 些 结构 中 的 某 一 个 ， 则 允许 引用 这 些 结构 中 任 
一 结构 的 公共 初始 部 分 。 例 如， 下 面 这 段 程序 是 合法 的 : 


union { 

struct { 

int type; 

} n; struct { 

int type; int intnode; 
} ni; struct { 

int type; 

float floatnode; 

} nf; 

上 u; 


u.nf.type = FLOAT; u.nf.floatnode = 3.14; 


if (u.n.type == FLOAT) 

... sin(u.nf.floatnode) ... 

A.8.4 ZS 

枚 举 类 型 是 一 种 特殊 的 类 型 ， 它 的 值 包含 在 一 个 命名 的 常量 集合 中 。 


这 些 币 量 称 为 枚 举 符 。 枚 举 说明 符 的 形式 借鉴 了 结构 说 明 符 和 联合 说 
明 符 的 形式 。 


枚 举 说 明 符 : 

enum 标识 符 opt { 枚 举 符 表 } enum 标识 符 

枚 举 符 表 : 

枚 举 符 

枚 举 符 表 , 枚 举 符 枚 举 符 : 

标识 符 

标识 符 = 常量 表达 式 

枚 举 符 表 中 的 标识 符 声 明 为 int 类 型 的 常量 ， 它 们 可 以 用 在 常量 可 以 
出 现 的 任何 地 方 。 如 果 其 中 不 包括 这 有 = 的 枚 举 符 ， 则 相应 常量 值 从 
0 开始 ， 且 枚 举 浓 量 值 从 左 至 右 依 次 递增 1。 如果 其 中 包括 带 有 = 的 枚 
举 符 ， 则 该 枚 举 符 的 值 由 该 表达 式 指定 ， 其 后 的 标识 符 的 值 从 该 值 开 
台 依次 递增 。 


同一 作用 域 中 的 各 枚 举 符 的 名 字 必 须 互 不 相同 ， 也 不 能 与 普通 变量 名 
相同 ， 但 其 值 可 以 相同 。 

枚 举 说 明 符 中 标识 符 的 作用 与 结构 说 明 符 中 结构 标记 的 作用 类 似 ， 它 
命名 了 一 个 特定 的 枚 举 类 型 。 除 了 不 存在 不 完整 枚 举 类 型 之 外 ， 枚 举 
说 明 符 在 有 无 标记 、 有 无 枚 举 符 表 的 情况 下 的 规则 与 结构 或 联合 中 相 
应 的 规则 相同 。 无 枚 举 符 表 的 枚 举 说 明 符 的 标记 必须 指向 作用 域 中 另 
一 个 具有 枚 举 符 表 的 说 明 符 。 

说 明 : 相 对 于 本 书 第 1 版 ， 枚 举 类 型 是 一 个 新 概念 ， 但 它 作 为 C 语言 的 
—-HOCALS FT . 

A.8.5 声明 符 

声明 符 的 语法 如 下 所 示 声明 符 : 


指针 opt 直接 声明 符 直接 声明 符 


标识 和 从 
(声明 符 ) 


直接 声明 符 [常量 表达 式 opt] 直接 声明 符 ( 形 式 参数 类 型 表 ) 直接 声明 
符 ( 标 识 表 opt) 


ta ET: 

* 类 型 限定 符 表 opt 

* 类 型 限定 符 表 opt 指针 类 型 限定 符 表 
类 型 限定 符 


类 型 限定 符 表 类 型 限定 符 声明 符 的 结构 与 间接 指针 、 画 数 及 数组 表达 
式 的 结构 类 似 ， 结 合 性 也 相同 。 

A.8.6 声明 符 的 含义 

声明 符 表 出 现在 类 型 说 明 符 和 存储 类 说 明 符 序列 之 后 。 每 个 声明 符 声 
明 一 个 帷 一 的 主 标 识 伯 ， 该 标识 符 是 直接 声明 符 产 生 式 的 第 一 个 候选 
式 。 存 储 类 说 明 符 可 直接 作用 于 该 标识 符 ， 但 其 类 型 由 声明 符 的 形式 
决定 。 当 声明 符 的 标识 符 出 现在 与 该 声明 符 形 式 相同 的 表达 式 中 时 ， 
该 声明 符 将 被 作为 一 个 断言 ， 其 结果 将 产生 一 个 指定 类 型 的 对 象 。 
如 果 只 考虑 声明 说 明 符 (参见 A.8.2 市 ) 的 类 型 部 分 及 特定 的 声明 符 ， 
则 声明 可 以 表示 为 “TD" 的 形式 ， 其 中 工人 代表 类 型 ，D 代表 声明 符 。 
在 不 同形 式 的 声明 中 ， 标 识 符 的 类 型 可 用 这 种 形式 来 表述 。 


在 声明 TD 中 ， 如 果 D 是 一 个 不 加 任何 限定 的 标识 符 ， 则 该 标识 符 的 
类 型 为 T。 在 声明 TD 中， 如 果 D 的 形式 为 : 


(D1) 


则 D1 中 标识 符 的 类 型 与 D 的 类 型 相同 。 贺 括号 不 改变 类 型 ， 但 可 改 
变 复 杂 声 明 符 之 间 的 结合 。 


1， 指 针 声 明 符 
在 声明 TD 中 ， 如 果 D 具有 下 列 形 式 : 


* 类 型 限定 符 表 D1 


且 声 明 工 D1 FAIA NRA A RAVES T", WD 中 标识 符 的 类 
型 为 "类 型 修饰 符 类 型 限定 符 表 指向 工 的 指针 "。 星 号 * 后 的 限定 符 作 
用 于 指针 本 映 ， 而 不 是 作用 于 指针 指向 的 对 象 。 

例如 。 考 虑 下 列 声 明 : 

int *ap[]; 

其 中 ，ap[] 的 作用 等 价 于 D1， 声 明 “ int ap[]" 将 把 ap 的 类 型 声明 为 
int 类 型 的 数组 "， 类 型 限定 符 表 为 空 ， 旦 类 型 修饰 符 为 ”....…. 的 数 
组 "。 因 此 ， 该 声明 实际 上 将 把 ap 声明 为 " 指 向 int 类 型 的 指针 数组 "类 


型 。 
BURA Ah — TBF oR SHA: 


int i, *pi, *const cpi = &i; 


const int ci = 3, *pci; 


声明 了 一 个 整 型 i 和 一 个 指向 整 型 的 指针 pi o BEE DCR Ettr cpi 的 
值 ， 该 指针 总 是 指向 同一 位 置 ， 但 它 所 指 之 处 的 值 可 以 改变 。 整 型 ci 
征 常 量 ， 也 不 能 修改 (可 以 进行 初始 化 ， 如 本 例 中 所 示 )。pci 的 类 型 
征 " 指 问 const int 的 指针 "，Ppci 本 吴 可 以 被 修改 以 指 同 另 一 个 地 方 ， 但 
它 所 指 之 处 的 值 不 能 通过 pei 赋值 来 改变 ， 


2 数组 声明 符 
在 声明 TD 中 ， 如 果 D 具有 下 列 形 式 : 
DIE ERIZE opt] 


且 声明 TD1 中 标识 符 的 类 型 是 "类 型 修饰 符 T"， 则 DD 的 标识 符 类 型 
为 "类 型 修 贤 符 了 类 型 的 数组 "。 如 有 果 人 存在 种 量 表达 式 ， 则 该 音量 表达 
式 必须 为 整 型 且 值 大 于 0。 帮 缺少 指定 数组 上 界 的 当量 表达 式 ， 则 该 
数组 类 型 是 不 完整 类 型 。 


数组 可 以 由 算术 类 型 、 指 针 类 型 、 结 构 类 型 或 联合 类 型 构造 而 成 ， 也 
可 以 由 男 一 个 数组 构造 而 成 (生成 多 维 数组 )。 构 造 数 组 的 类 型 必须 是 
完整 类 型 ， 绝 对 不 能 是 不 完整 类 型 的 数组 或 结构 。 也 吏 是 说 ， 对 于 多 
维 数组 来 说 ， 只 有 第 一 维 可 以 缺 省 。 对 于 不 完整 数组 类 型 的 对 象 来 
说 ， 其 类 型 可 以 通过 对 该 对 象 进行 另 一 个 完整 声明 (参见 A.10.2 TH) BY 
初始 化 (参见 A.8.7 市) 来 使 其 完整 。 例 如 : 


float fa[17], *afp[17]; 

声明 了 一 个 浮 点 数 数组 和 一 个 指 回 浮 点 数 的 指针 数组 ， 而 

Static int x3d[3][5][7]; 

则 声明 了 一 个 静态 的 三 维 整 型 数组 ， 其 大 小 为 3x5x7。 具 体 来 说 ，x3d 
是 一 个 由 3 个 页 组 成 的 数组， 每 个 页 都 是 由 5 个 数组 组 成 的 一 个 数 
组 ，5 个 数组 中 的 每 个 数组 又 都 是 由 7 个 整 型 数组 成 的 数组 。x3d、 


X3d[fi、x3d[i[j 与 x3d[i[j][Ik 都 可 以 合法 地 出 现在 一 个 表达 式 中 。 前 
三 者 是 数组 类 型 ， 最 后 一 个 是 int 类 型 。 更 准确 地 说 ，x3d[i][j] 是 一 个 


有 7 个 整 型 TAMAH xdi EA 5 个 元 素 的 数组 ， 而 其 中 的 每 个 
元 素 又 是 一 个 具有 7 个 整 型 元 素 的 数组 。 


根据 数组 下 标 运 算 的 定义 ，E1[E2] 等 价 于 *(E1+E2)。 因 此 ， 尽 管 表达 

式 的 形式 看 上 去 不 对 称 ， 但 下 标 运 算是 可 交换 的 运算 。 根 据 适用 于 运 
算 符 + 和 数组 的 转换 规则 (参见 A.6.6 节 、A.7.1 节 与 A.7.7 1%), # E1 

是 数组 日 E2 是 整数 ， 则 E1[E2] 代 表 El 的 第 E2 个 成 员 。 


在 本 例 中 ，x3d[i][j][k] 等 价 于 *(x3d[i][j+k)。 第 一 个 子 表达 式 x3d [i] fj] 

将 按照 A.7.1 节 中 的 规则 转换 为 “指向 整 型 数组 的 指针 ”类 型 ， 而 根据 
A.7.7 节 中 的 规则 ， 这 里 的 加 法 运算 需要 乘 以 整 型 类 型 的 长 度 。 它 遵 

循 下 列 规则 :数组 按 行 存储 (最 后 一 维 下 标 变动 最 快 )， 且 声明 中 的 第 一 
和 但 第 一 维 下 标 在 下 标 计 算 时 无 其 
L (0) 


3 函数 声明 符 
在 新 式 的 函数 声明 TD 中 ， 如 果 D 具有 下 列 形式 : 
D1( 形 式 参 数 类 型 表 ) 


HHA, RAAT D1 PMWM RA RA EIA T", Ml D 的 标识 符 类 
型 是" 返回 工 类 型 值 且 具 有 6 形式 参数 类 型 表 ' 中 的 参数 的 6 类 型 修饰 
符 ' 类 型 的 函数 "。 


形式 参数 的 语法 定义 为 : 形式 参数 类 型 表 : 

形式 参数 表 形式 参数 表 , .… 

形式 参数 表 : 

形式 参数 声明 

形式 参数 表 , 形式 参数 声明 形式 参数 声明 : 

声明 说 明 符 声明 符 声明 说 明 符 抽象 声明 符 opt 

在 这 种 新 式 的 声明 中 ， 形 式 参数 表 指 定 了 形式 参数 的 类 型 。 这 里 有 一 
个 特例 ， 按 照 新 式 方式 声明 的 无 形式 参数 画 数 的 声明 符 也 有 一 个 形式 
参数 表 ， 该 表 仅 包含 关键 字 void。 如果 形式 参 数 表 以 省 略 号 , …" 结 
尾 ， 则 该 函数 可 接受 的 实际 参数 个 数 比 显 式 说 明 的 形式 参数 个 数 要 
多 。 详 细 信 息 参 见 A.7.3 T ° 

如 采 形 式 参 数 类 型 是 数组 或 画 数 ， 按 照 参数 转换 规则 (参见 A.10.1 
节 )， 它 们 将 被 转换 为 指针 。 形 式 参数 的 声明 中 惟一 允许 的 存储 类 说 
明 符 是 register， 并 且 ， 除 非 画 数 定义 的 开 头 包 括 函 数 声明 符 ， 否 则 该 
存储 类 说 明 符 将 被 忽略 。 类 似 地 ， 如 采 形 式 参 数 声明 中 的 声明 符 包含 
标识 符 ， 且 函数 定义 的 开头 没有 函数 声明 符 ， 则 该 标识 符 超 出 了 作用 
域 。 不 涉及 标识 符 的 抽象 声明 符 将 在 A.8.8 万 中 讨论 。 

在 旧式 的 函数 声明 TD 中 ， 如 果 D 具有 下 列 形式 : 

D1( 标 识 符 表 opt) 

并 且 声 明 D1 中 的 标识 符 的 类 型 是 "类 型 修饰 特 T"， 则 DD 的 标识 符 类 
型 为 "返回 T 类 型 值 且 末 指定 参数 的 6 类 型 修饰 符 ' 类 型 的 函数 "。 形 式 
参数 (如 果 有 的 话 ) 的 形式 如 下 : 


标识 符 表 : 


标识 和 从 


标识 符 表 , 标识 符 在 旧式 的 声明 符 中 ， 除 非 在 函数 定义 的 前 面 使 用 了 
声明 符 ， 否 则 ， 标 识 符 表 必须 空缺 (参见 


A.10.1 市 )。 声 明 不 提供 有 关 形 式 参 数 类 型 的 信息 。 
例如 ， 下 列 声明 : 
int f0), *fpi(), (*pfi)(); 


声明 了 一 个 返回 整 型 值 的 钞 数 f、 一 个 返回 指向 整 型 的 指针 的 函数 fpi 
以 及 一 个 指向 返回 整 


eae ee 
9 声明 。 


在 下 列 新 式 的 声明 中 : 

int strcpy(char *dest, const char *source), rand(void); 

strcpy 是 一 个 返回 int 类 型 的 函数 ， 它 有 两 个 实际 参数 ， 第 一 个 实际 参 
数 是 一 个 字符 指针 ， 第 一 个 实际 参数 星 一 个 指向 常量 字符 的 指针 。 其 
中 的 形式 参数 名 字 可 以 起 到 注释 说 明 的 作用 。 第 二 个 函数 rand 不 市 参 
数 ， 且 返回 类 型 为 int。 

WHR: H RWIE, WIERSZU EKA E H E ANSI 标准 中 引入 
的 最 重要 的 一 个 语 言 变 化 。 它 们 优 于 第 1 版 中 的 "旧式 "声明 符 ， 因 为 
它们 提供 了 函数 调用 时 的 错误 检查 和 参 数 强制 转换 ， 但 引入 的 同时 也 
市 来 了 很 多 混乱 和 麻烦 ， 而 且 还 必须 兼 客 这 两 种 形式 。 为 了 保 FP 
容 ， 就 不 得 不 在 语法 上 进行 一 些 处 理 ， 即 采用 void 作为 新 式 的 无 形式 
参数 函数 的 显 式 标记 。 

KAHERE", FR KE RSS CGE EE ANSI 标准 中 新 引入 
IN, FFA, 28 合 标准 头 文件 <stdarg.h> 中 的 一 些 安 ， 共 同 将 这 个 机 制 
正式 化 了 。 该 机 制 在 第 1 版 中 是 官 方 上 葵 止 的 ， 但 可 非 正式 地 使 用 。 
这 些 表 示 法 起 源 于 C++ 。 

A.8.7 初始 化 

声明 对 象 时 ， 对 象 的 初始 化 声明 符 可 为 其 指定 一 个 初始 值 。 初 值 紧 跟 
在 运算 符 = 之 后 ， 它 可 以 是 一 个 表达 式 ， 也 可 以 是 骨 套 在 化 括号 中 的 
初 值 序 列 。 初 值 序列 可 以 以 逗号 结束 ， 这 样 可 以 使 格式 简洁 美观 。 
初 值 : 

赋值 表达 式 

{ 初 值 表 } 


{ 初 值 表 ,} 


初 值 表 : 
初 值 
WIE, 初 值 


对 静态 对 象 或 数组 而 言 ， 初 值 中 的 所 有 表达 式 必 须 古 A.7.19 节 中 摘 述 
的 第 量 表达 式 。 如 琳 初 值 是 用 人 花 括号 括 起 来 的 初 值 表 ， 则 对 auto 或 
register 类 型 的 对 象 或 数组 来 说 ， 初 值 中 的 表达 式 也 同样 必须 是 种 量 
达 式 。 但 是 ， 如 末 目 动 对 象 的 初 值 是 一 个 单个 的 表达 式 ， MEDVE 
常量 表达 式 ， 但 必须 符合 对 象 赋值 的 类 型 要 求 。 


说 明 : 第 1 版 不 文 持 目 动 结构 、 联 合 或 数组 的 初始 化 。 而 ANSI 标准 是 
允许 的 ， 但 只 能 通过 常量 结构 进行 初始 化 ， 除 非 初 值 可 以 通过 倘 单 表 
达 式 表示 出 来 。 


未 显 式 初 始 化 的 静态 对 象 将 被 隐 式 初始 化 ， 其 效果 等 同 于 它 ( 或 它 的 成 
员 ) 补 赋 以 常量 0。 未 显 式 初 始 化 的 目 动 对 象 的 初始 值 没 有 定义 。 


旨 针 或 算术 类 型 对 象 的 初 值 是 一 个 单个 的 表达 式 ， 也 可 能 括 在 伦 括 号 
中 。 该 表达 式 将 赋 值 给 对 象 。 


结构 的 初 值 可 以 是 类 型 相同 的 表达 式 ， 也 可 以 是 括 在 花 括 号 中 的 按 其 
成 员 次 序 排列 的 初 值 表 。 无 名 的 位 字段 成 员 将 被 名 略 ， 因 此 不 被 初始 
化 。 如 采 表 中 初 值 的 数目 比 结构 的 成 员 数 少 ， 则 后 面 余下 的 结构 成 员 
将 被 初始 化 为 0。 初 值 的 数目 不 能 比 成 员 数 多 。 


数组 的 初 值 是 一 个 括 在 伦 括 号 中 的 、 由 数组 成 员 的 初 值 构成 的 表 。 如 
果 数 组 大 小 未 知 ， 则 初 值 的 数目 将 决定 数组 的 大 小 ， 从 而 使 数组 类 型 
成 为 完整 类 型 。 厦 数组 大 小 固定 ， 则 初 值 的 数目 不 能 超过 数组 成 员 的 
数目 。 如 采 初 值 的 数目 比 数组 成 员 的 数目 少 ， 则 尾部 余下 的 数组 成 员 
将 被 初始 化 为 0。 


这 里 有 一 个 特例 :字符 数组 可 用 字符 溃 字 面值 初始 化 。 字 符 串 中 的 各 个 
字符 依次 初始 化 数组 中 的 相应 成 员 。 类似 地 ， 宽 字符 字面 值 (参见 
A.2.6 帮 ) 可 以 初始 化 wchar { 类 型 的 数 组 。 帮 数组 大 小 未 知 ， 则 数组 
大 小 将 由 字符 串 中 字符 的 数目 (包括 尾部 的 空 字符 ) 决 是 。 邦 数组 大 小 
J 则 字符 串 中 的 字符 数 (不 计 尾部 的 空 字符 ) 不 能 超过 数组 的 大 


联合 的 初 值 可 以 是 类 型 相同 的 单个 表达 式 ， 也 可 以 是 括 在 花 括 号 中 的 
联合 的 第 一 个 成 员 的 初 值 。 


说 明 : 第 1 版 不 允许 对 联合 进行 和 始 化 。" 第 一 个 成 员 "规则 并 不 很 完 
F, BERADA 法 的 情况 下 很 难 对 它 进行 一 般 化 。 除 了 至 少 允 许 以 
一 种 简单 方式 对 联合 进行 显 式 初始 化 外 ，ANSI 规则 还 给 出 了 非 显 式 
初始 化 的 静态 联合 的 精确 语义 。 


聚集 是 一 个 结构 或 数组 。 如 果 一 个 聚集 包含 聚集 类 型 的 成 员 ， 则 初始 
化 时 将 递归 使 用 初 始 化 规则 。 在 下 列 情况 的 初始 化 中 可 以 省 略 括 号 :如 
果 聚 集 的 成 员 也 足 一 个 聚集 ， 且 该 成 员 的 初始 化 人 符 以 左 花 括号 开 尖 ， 
则 后 续 部 分 中 用 如 号 隔 开 的 初 值 表 将 初始 化 于 率 集 的 成 员 。 初 值 的 数 
目 不 允 许 超 过 成 员 的 数目 。 但 古 ， 如 果子 案 集 的 初 值 不 以 左 花 括号 开 
头 ， 则 只 从 初 值 表 中 取出 足够 数目 的 元 素 作 为 于 聚集 的 成 员 ， 其 它 剩 
余 的 成 员 将 用 来 初始 化 该 子 聚 集 所 在 的 聚集 的 下 一 个 成 员 。 


例如 : 
int x[] = { 1, 3, 5 }; 


将 x 声明 并 初始 化 为 一 个 具有 3 个 成 员 的 一 维 数组 ， 这 是 因为 ， 数 组 
未 指定 大 小 且 有 3 个 初 值 。 下 面 的 例子 : 


float y[4][3] = { 


是 一 个 完全 用 花 括 号 分 隔 的 初始 化 :1、3 和 5 这 3 个 数 初始 化 数组 y[0] 
的 第 一 行 ， 即 y[0][0] 、y[0][1j 和 y[0][2]。 类 似 地 ， 另 两 行将 初始 化 
y[1] 和 y[2]。 因 为 初 值 的 数目 不 够 ， 所 以 y[3] 中 的 元 素 将 被 初始 化 为 
0， 完 全 相同 的 效果 还 可 以 通过 下 列 声明 获得 : 


float y[4][3] = { 

1, 3, 5, 2, 4, 6, 3, 5,7 

}; 

y 的 初 值 以 左 花 括号 开始 ， 但 y[0] 的 初 值 则 没有 以 左 花 括号 开始 ， 因 
此 y[0] 的 初始 化 将 使 用 表 中 的 3 个 元 素 。 同 理 ，y[1] 将 使 用 后 续 的 3 
个 元 素 进 行 初 始 化 ，y[2] 依 此 类 推 。 男 外 ， 下列 声 明 : 

float y[4][3] = { 

{1}, {2}, {3}, {4} 

}; 


将 初始 化 y 的 第 一 列 (将 y 看 成 为 一 个 二 维 数组 )， 其 余 的 元 素 将 默认 
初始 化 为 0。 最 后 


char msg[] = "Syntax error on line %s\n"; 


声明 了 一 个 字符 数组 ， 并 用 一 个 字符 串 字 面值 初始 化 该 字 答 数 组 的 元 
素 。 该 数组 的 大 小 包括 尾部 的 空 字符 。 


A.8.8 类 型 名 

在 某 些 上 下 文中 (例如 ， 需 要 显 式 进行 强制 类 型 转换 、 需 要 在 函数 声明 
符 中 声明 形式 参 数 类 型 、 作 为 sizeof 的 实际 参数 等 )， 我 们 需要 提供 数 
据 类 型 的 名 字 。 使 用 类 型 名 可 以 解决 这 个 问题 ， 从 语法 上 讲 ， 也 就 是 
对 某 种 类 型 的 对 象 进行 声 明 ， 只 是 省 略 了 对 象 的 名 字 而 已 。 

类 型 名 : 

说 明 符 限 定 符 表 抽象 声明 符 opt 

抽象 声明 符 : 指针 

STT opt 直接 抽象 声明 符 直接 抽象 声明 符 


(抽象 声明 符 ) 
直接 抽象 声明 符 opt [常量 表达 式 opt] 
直接 抽象 声明 符 opt (形式 参数 类 型 表 opt) 


如 果 该 结构 是 声明 中 的 一 个 声明 符 ， 束 有 可 能 惟一 确定 标识 符 在 抽象 
声明 符 中 的 位 置 。 命 名 的 类 型 将 与 假设 标识 符 的 类 型 相同 。 例 如 : 


int int * 


int *[3] int (*)[] int *Q 

int (*[])(void) 

其 中 的 6 个 声明 分 别 命名 了 下 列 类 型 :“ 整 型 *、“ 指 向 整 型 的 指针 ”、“ 包 
A 3 个 指向 整 型 的 指针 的 数组 *”、“ 指 向 未 指定 元 素 个 数 的 整 型 数组 的 
站 秆 ”、“ 未 指定 参数 、 返 回 指 册 整 型 的 指 针 的 函数 "、“ 一 个 数组 ， 其 
长 度 未 指定 ， 数 组 的 元 素 为 指 同 函 数 的 指针 ， 该 函数 没有 参数 且 返 E 
一 个 整 型 值 " 。 

A.8.9 typedef 


存储 类 说 明 符 为 typedef 的 声明 不 用 于 声明 对 象 ， 而 是 定义 为 类 型 命名 
的 标识 符 。 这 些 标识 符 称 为 类 型 定义 和 名。 


类 型 定义 名 : 

标识 符 

typedef 声明 按照 普通 的 声明 方式 将 个 类 型 指派 给 其 声明 符 中 的 每 个 名 
字 ( 参 见 A.8.6 节 )。 此 后 ， 类 型 定义 名 在 语法 上 束 等 价 于 相关 类 型 的 
类 型 说 明 符 关键 字 。 

例如 ， 在 定义 


typedef long Blockno, *Blockptr; 

typedef struct { double r, theta; } Complex; 
之 后 ， 下 述 形式 : 

Blockno b; 


extern Blockptr bp; Complex z, *zp; 


都 是 合法 的 声明 。b 的 类 型 为 long，bp 的 类 型 为 "指向 long 类 型 的 指 
针 "。z 的 类 型 为 指 


定 的 结构 类 型 ，zp 的 类 型 为 指向 该 结构 的 指针 。 

typedef 类 型 定义 并 没有 引入 新 的 类 型 ， 它 只 是 定义 了 数据 类 型 的 同 义 
w, X$, BLE] 以 通过 男 一 种 方式 进行 类 型 声明 。 在 本 侧 中 , b 与 其 
它 任 何 long 类 型 对 象 的 类 型 相同 。 

类 型 定义 名 可 在 内 层 作用 域 中 重新 声明 ， 但 必须 给 出 一 个 非 空 的 类 型 
说 明 符 集合 。 例 如 ， 下列 声明 : 


extern Blockno; 


并 没有 重新 声明 Blockno， 但 下 列 声 明 : extern int Blockno; 


则 重新 声明 了 Blockno ° 

A.8.10 类 型 等 价 

如 果 两 个 类 型 说 明 符 表 包 含 相同 的 类 型 说 明 符 集合 (需要 考 虚 类 型 说 明 
符 之 间 的 续 调 关系， 例如 ， 单 独 的 long AS T long int)， 则 这 两 个 类 
型 说 明 符 表 是 等 价 的 。 具 有 不 同 标记 的 结构 、 不 同 标记 的 联合 和 不 同 
标记 的 枚 举 是 不 等 价 的 ， 无 标记 的 联合 、 无 标记 的 结构 或 无 标记 的 枚 
举 指定 的 类 型 也 是 不 等 价 的 。 

在 展开 其 中 的 任何 typedef 类 型 并 删除 所 有 函数 形式 参数 标识 符 后 ， 如 
果 两 个 类 型 的 抽 象 声 明 符 (参见 A.8.8 广 ) 相 同 ， 且 它们 的 类 型 说 明 符 
表 等 价 ， 则 这 两 个 类 型 是 相同 的 。 数 组 长 度 和 芳 数 形式 参数 类 型 是 其 
中 很 重要 的 因素 。 


A.9 语 旬 


如 果 不 特别 指明 ， 语 句 都 是 顺序 执行 的 。 语 句 执行 都 有 一 定 的 结果 ， 
但 没有 值 。 语 句 可 分 为 几 种 类 型 。 


语句 |: 

带 标 号 语句 表达 式 语 句 复合 语句 选择 语句 循环 语句 跳 转 语句 
A.9.1 带 标 号 语句 

语句 可 带 有 标号 前 缀 。 Win sie A: 

标识 符 : 语句 

case 常量 表达 式 : 语句 


default: 语句 由 标识 符 构 成 的 标号 声明 了 该 标识 符 。 标 识 符 标 号 的 惟 
一 用 途 束 是 作为 goto 语句 的 跳 转 目 


标 。 标识 符 的 作用 域 是 当前 函数 。 因 为 标号 有 目 己 的 名 字 空 间 ， 因 此 
不 会 与 其 它 标 识 符 宴 消 ， 


并 且 不 能 被 重新 声明 。 详 细 信 息 参 见 A.11.1 条 。 


case 标号 和 default 标号 用 在 switch 语句 中 (参见 A.9.4 T) ° case 标号 
中 的 常量 


表达 式 必须 为 整 型 。 
标号 本 里 不 会 改变 程序 的 控制 流 。 


A.9.2 HeIA Ti A) 
大 部 分 语句 为 表达 式 语句 ， 其 形式 如 下 所 示 : 表达 式 语 人 句 : 
表达 式 opt; 


大 多 数 表 达 式 语句 为 赋值 语句 或 函数 调用 语句 。 表 达 式 引起 的 所 有 副 
作用 在 下 一 条 语句 执行 前 结束 。 没 有 表达 式 的 语句 称 为 空 语句 。 空 语 
句 常常 用 来 为 循环 语句 提供 一 个 空 的 循环 体 或 设置 标号 。 

A.9.3 AEA) 


Smile TAR AEA A AY, FDR AR AAEE 
TYRE ER") o EX BOE SOP ALE TE GB A) o 


复合 语句 : 
{声明 表 opt 语句 表 opt} 
声明 表 : 

声明 

声明 表 声明 语 自 表 
语句 


语句 表 语句 如 采 声 明 表 中 的 标识 符 位 于 程序 块 外 的 作用 域 中 ， 则 外 部 
声明 在 程序 块 内 将 被 挂 起 (参见 


A.11.1 三 )， 和 在 同一 程序 块 中 ， 一 个 标识 
符 只 能 声明 一 次 。 此 规 


WW ta Te — 4 SB ETA (BOL A.11 市 )， 不 同名 字 空 间 的 标 
识 符 被 认为 是 不 同 的 。 


自动 对 象 的 初始 化 在 每 次 进入 程序 块 的 顶端 时 执行 ， 执 行 的 顺序 按照 
声明 的 顺序 进行 。 如 果 执 行 跳 转 语句 进入 程序 块 ， 则 不 进行 初始 化 。 
Static 类 型 的 对 象 仅 在 程序 开始 执行 前 初 始 化 一 次 。 

A.9.4 选择 语句 


选择 语句 包括 下 列 儿 种 控制 流 形式 : 选择 语句 ]: 


if ( 表 选 式 ) 语句 


if (表达 式 ) 语句 else 语句 
switch (表达 式 ) 语句 


在 两 种 形式 的 证 语句 中 ， 表 达 式 (必须 为 算术 类 型 或 指针 类 型 ) 首 先 被 

求 值 (包括 所 有 的 副作用 )， 如 有 果 不 等 于 0， 则 执行 第 一 个 子 语句 。 在 

第 二 种 形式 中 ， 如 果 表 达 式 为 0， 则 执行 第 二 个 子 语句 ， 通 过 将 else 

与 同一 风 套 层 中 碰 到 的 最 近 的 未 匹配 else 的 if EH, FT 以 解决 else 
的 收 义 性 问题 。 


switch 语句 根据 表达 式 的 不 同 取 值 将 控制 转向 相应 的 分 支 。 关 键 字 
switch 之 后 用 圆 括 号 括 起 来 的 表达 式 必 须 为 整 型 ， 此 语句 控制 的 子 语 
名 一般 是 复合 语句 。 子 语句 中 的 任何 语句 可 带 一 个 或 多 个 case 标号 
(参见 A.9.1 T) 。 控 制 表 达 式 需要 进行 整 型 提升 (参见 A.6.1 7), case 
常量 将 被 转换 为 整 型 提升 后 的 类 型 。 同 一 switch 语句 中 的 任何 两 个 
case 常量 在 转换 后 不 能 有 相同 的 值 。 一 个 switch 语句 最 多 可 以 有 一 个 
default 标号 。swltch 语句 可 以 艇 Æ, case 或 default 标号 与 包含 它 的 最 
近 的 switch 相关 联 。 


switch 语句 执行 时 ， 首 先 计算 表达 式 的 值 及 其 副作用 ， 并 将 其 值 与 每 
个 case 常量 比较 ， 如 果 某 个 case 常量 与 表达 式 的 值 相同 ， 则 将 控制 
转 同 与 该 case 标号 匹配 的 语句 。 如 果 没 有 case 第 量 与 表达 式 匹 配 ， 并 
且 有 default 标号 ， 则 将 控制 转向 default 标号 的 语句 。 如 果 没 有 case 
常量 匹配 ， 且 没有 default 标号 ， 则 switch 语句 的 所 有 子 语句 都 不 执 
行 。 


说 明 : 在 本 书 第 1 版 中 ，switch 语句 的 控制 表达 式 与 case 常量 都 必须 为 
int 类 型 。 


A.9.5 循环 语句 
循环 语句 用 于 指定 程序 段 的 循环 执行 。 循 环 语句 
while (表达 式 ) 语句 


do 语句 while (表达 式 ); 


for (表达 式 opt; 表达 式 opt; FIAT opt) 语句 


在 while 语句 和 do 语句 中 ， 只 要 表达 式 的 值 不 为 0， 其 中 的 子 语句 将 
一 直 重复 执行 。 表 达 式 必须 为 算术 类 型 或 指针 类 型 。while 语句 在 语 
名 执行 前 测试 表达 式 ， 并 计算 其 副作用 ， 而 do 语句 在 每 次 循环 后 测 
试 表达 式 。 


在 for 语 名 中， 第 一 个 表达 式 只 计算 一 次 ， 用 于 对 循环 初始 化 。 该 表 
达 式 的 类 型 没有 限 制 。 第 二 个 表达 式 必须 为 算术 类 型 或 指针 类 型 ， 在 
每 次 开始 循环 前 计算 其 值 。 如 有 果 该 表达 式 的 值 等 于 0， 则 for 语句 终 
止 执 行 。 第 三 个 表达 式 在 每 次 循环 后 计算 ， 以 重新 对 循环 进行 初 始 

化 ， 其 类 型 没有 限制 。 所 有 表达 式 的 副作用 在 计算 其 值 后 立即 结 

如 果子 语句 中 没有 continue 语句 ， 则 语句 


for (表达 式 1; 表达 式 2; RAR 3) 语句 等 价 于 


表达 式 1; 

while (表达 式 2) { 
语句 表达 式 3; 
} 


for 语句 中 的 3 个 表达 式 中 都 可 以 省 略 。 第 二 个 表达 式 省 略 时 等 价 于 测 
试 一 个 非 0 常量 。 


A.9.6 跳 转 语 句 

跳 转 语句 用 于 无 条 件 地 转移 控制 。 跳 转 语 句 : 
goto 标识 符 ; continue; 

break; 

return 表达 式 opt; 


在 goto 语句 中 ， 标 识 符 必 须 是 位 于 当前 画 数 中 的 标号 (参见 A.9.1 
节 )。 控 制 将 转移 到 标号 指 定 的 语句 。 


continue 语句 只 能 出 现在 循环 语句 内 ， 它 将 控制 转向 包含 此 语句 的 最 
内 层 循环 部 分 。 更 准确 地 说 ， 在 下 列 任 一 语句 中 : 


while (...) { do { for (...) { 
contin: ; contin: ; contin: ; 
} } while (...); } 


WR continuet 语句 不 包含 在 更 小 的 循环 语句 中 ， 则 其 作用 与 goto 


contin 语句 等 价 。 


break 语句 只 能 用 在 循环 语句 或 switch 语句 中 ， 它 将 终止 包含 该 语句 
的 最 内 层 循环 语 句 的 执行 ， 并 将 控制 转向 被 终止 语句 的 下 一 条 语句 。 


return 语句 用 于 将 控制 从 函数 返回 给 调用 者 。 当 return 语句 后 跟 一 个 表 
达 式 时 ， 表 达 式 的 值 将 返回 给 函数 调用 者 。 像 通过 赋值 操作 转换 类 型 
那样 ， 该 表达 式 将 被 转换 为 它 所 在 的 函数 的 返回 值 类 型 。 


控制 到 达 画 数 的 结尾 等 价 于 一 个 不 市 表达 式 的 return 语句 。 在 这 两 种 
情况 下 ， 返 回 值 都 是 没有 定义 的 。 


A.10 外 部 声明 


提供 给 C 编译 器 处 理 的 输入 单元 称 为 翻译 单元 。 它 由 一 个 外 部 声明 序 
列 组 成 ， 这 些 外 部 声明 可 以 是 声明 ， 也 可 以 是 函数 定义 。 


翻译 单元 : 

外 部 声明 

翻译 单元 外 部 声明 外 部 声明 

函数 定义 声明 

与 程序 块 中 声明 的 作用 域 持 续 到 整个 程序 块 的 末尾 类 似 ， 外 部 声明 的 
作用 域 一 直 持 续 到 其 所 在 的 翻译 单元 的 末尾 。 外 部 声明 除了 只 能 在 这 
一 级 上 给 出 函数 的 代码 外 ， 其 语法 规则 与 其 它 所 有 声明 相同 。 
A.10.1 函数 定义 

函数 定义 具有 下 列 形 式 : 函数 定义 : 


声明 说 明 符 opt 声明 符 声明 表 opt 复合 语句 声明 说 明 符 中 只 能 使 用 存 
储 类 说 明 符 extern 或 static。 有 关 这 两 个 存储 类 说 明 符 之 间 的 区 

别 ， 参 见 A.11.2 Ý ° 

范 数 可 返回 算术 类 型 、 结 构 、 联 合 、 指 针 或 vold 类 型 的 值 ， 但 不 能 返 
回落 数 或 数组 类 型 。 画 数 声 明 中 的 声明 符 必须 显 式 指定 所 声明 的 标识 
符 具 有 函数 类 型 ， 也 就 是 说 ， 必 须 包 含 下 列 两 种 形式 之 一 (参见 A.8.6 
TY: 


直接 声明 符 (形式 参数 类 型 表 ) 直接 声明 符 ( 标 识 符 表 opt) 


其 中 ， 直 接 声 明 符 可 以 为 标识 符 或 用 圆 括号 括 起 来 的 标识 符 。 特 别 
是 ， 不 能 通过 typedef 定 义 函 数 类 型 。 


第 一 种 形式 是 一 种 新 式 的 画 数 定义 ， 其 形式 参数 及 类 型 都 在 形式 参数 
类 型 表 中 声明 ， 函 数 声明 符 后 的 声明 表 必 须 空缺 。 除 了 形式 参数 类 型 


表 中 只 包含 void 类 型 (表明 该 男 数 没有 形 式 参 数 ) 的 情况 外 ， 形 式 参数 
类 型 表 中 的 每 个 声明 符 都 必须 包含 一 个 标识 待 。 如 采 形 式 参数 类 型 表 
Die, …" 结 束 ， 则 调用 该 男 数 时 所 用 的 实际 参数 数目 就 可 以 多 于 形式 参 
BULA > va_arg 安 机 制 在 标准 头 文件 <stdarg.hm) 中 定义 ， 必 须 使 用 它 来 
引用 额外 的 参数 ， 我 们 将 在 附录 B 中 介绍 。 带 有 可 变形 式 参 数 的 函数 
必须 至 少 有 一 个 命名 的 形式 参数 。 


第 二 种 形式 是 一 种 旧式 的 函数 定义 :标识 答 表 列 出 ， 形 式 参 数 的 名 字 ， 
这 些 形式 参数 的 


类 型 由 声明 表 指 是 。 对 于 未 声明 的 形式 参数 ， 其 类 型 于 认为 int F 
型 。 声 明 表 必须 只 声明 标 识 符 表 中 指定 的 形式 参数 ， 不 允许 进行 初始 
化 ， 并 且 仅 可 使 用 存储 类 说 明 符 register ° 


在 这 两 种 方式 的 函数 定义 中 ， 可 以 这 样 理 解 形式 参数 :在 构成 钞 数 体 的 
复合 语句 的 开始 处 进行 声明 ， 并 且 在 该 复合 语句 中 不 能 重复 声明 相同 
的 标识 符 ( 但 可 以 像 其 它 标 识 符 一 样 在 该 复合 语句 的 内 层 程 序 块 中 重 
新 声明 )。 如 果菜 一 形式 参数 声明 的 类 型 为 < type 类 型 的 数组 "， 则 该 
声明 将 会 被 自动 调整 为 "指向 type 类 型 的 指针 "。 类 似 地 ， 如 果 某 一 形 
式 参数 声明 为 " 返 回 type 类 型 值 的 钞 数 "， 则 该 声明 将 会 补 调 整 为 " 指 
HAIE] type 类 型 值 的 函数 的 指针 "。 调 用 函数 时 ， 必 要 时 要 对 实际 参 
数 进行 类 型 转换 ， 然 后 赋值 给 形式 参数 ， 详 细 信 息 参 见 A.7.3 条 。 


Bi rT ENR Me ANSI 标准 新 引入 的 一 个 特征 。 有 关 提 升 的 一 些 
细节 也 有 细微 的 变化。 第 1 版 指定 ，float 类 型 的 形式 参数 声明 将 被 调 
整 为 double 类 型 。 当 在 函数 内 部 生成 一 个 指 回 形式 参数 的 指针 时 ， 它 
们 之 间 的 区 别 束 显而易见 了 。 


下 面 是 一 个 新 式 函 数 定义 的 完整 例子 : 


int max(int a, int b, int c) 
{ 

int m; 
m=(a>b)?a:b; 
return (m > c)? m: cC; 

} 


HEt, int 是 声明 说 明 符 ;max(int a, int b, int @O 是 函数 的 声明 符 ;{..} 是 K 
数 代码 的 程序 块 。 相 应 的 旧式 定义 如 下 所 示 : 


int max(a, b, c) 


int a, b, c; 


其 中 ，int max(a, b, co) 是 声明 符 ，int a, b, c; 是 形式 参数 的 声明 表 。 
A.10.2 外 部 声明 

外 部 声明 用 于 指定 对 象 、 函数 及 其 它 标 识 符 的 特性 o 术语 "外 部 "表明 
它们 位 于 函数 外 部， 并且 不 直接 与 关键 字 extern 连接 。 外 部 声明 的 对 
象 可 以 不 指定 存储 类 ， 也 可 指定 为 extern 或 static ° 


同一 个 标识 符 的 多 个 外 部 声明 可 以 共存 于 同一 个 翻译 单元 中 ， 但 它们 
的 类 型 和 连接 必须 保持 一 致 ， 并 且 标识 符 最 多 只 能 有 一 个 定义 。 


如 果 一 个 对 象 或 函数 的 两 个 声明 遵循 A.8.10 节 中 所 壕 的 规则 ， 则 认为 
它们 的 类 型 是 一 致 的 。 并 且 ， 如 采 两 个 声明 之 间 的 区 别 仅仅 在 于 :其 中 
一 个 的 类 型 为 不 完整 结构 、 联 合 或 枚 举 类 型 (参见 A.8.3 1), MA 

个 是 对 应 的 带 同 一 标记 的 完整 类 型 ， 则 认为 这 两 个 类 型 是 一 致 的 。 此 
外 ， 如 采 一 个 类 型 为 不 完整 数组 类 型 (参见 A.8.6 节 )， 而 男 一 个 类 型 为 
完整 数组 类 型 ， 其 它 属性 都 相同 ， 则 认为 这 两 个 类 型 是 一 致 的 。 基 

后 ， 如 果 一 个 类 型 指定 了 一 个 旧式 函数 ， 而 另 一 个 类 型 指定 了 带 形 式 
人 
是 一 致 的 。 


如 采 一 个 对 象 或 函数 的 第 一 个 外 部 声明 包含 static 说 明 符 ， 则 该 标识 
符 具 有 内 部 连接 ， 否则 具有 外 部 连接 。 有 关连 接 的 详细 信息 ， 参 见 
A.11.2 方 中 的 讨论 。 


如 林 一 个 对 象 的 外 部 声明 市 有 初 值 ， 则 该 声明 就 是 一 个 定义 。 如 采 一 
个 外 部 对 象 声 明 不 市 有 初 值 ， 并 且 不 包含 extern 说 明 符 ， 则 它 是 一 个 
临时 定义 。 如 有 果 对 象 的 定义 出 现在 翻译 单元 中 。 则 所 有 临时 定义 都 将 
仅 仪 被 认为 是 多 余 的 声明 ;如 采 该 翻译 单元 中 不 存在 该 对 象 的 定义， 则 
该 临时 定义 将 转变 为 一 个 初 值 为 0 的 定义 。 


每 个 对 象 都 必须 有 且 仅 有 一 个 定义 。 对 于 具有 内 部 连接 的 对 象 ， 该 规 
则 分 别 适用 于 每 个 翻译 单元 ， 这 是 因为 ， 内 部 连接 的 对 象 对 每 个 翻译 
单元 是 惟一 的 。 对 于 具有 外 部 连接 的 对 象 ， 该 规则 适用 于 整个 程序 。 


说 明 : 虽 然 单 一 定义 规则 (One*definition rule) 在 表达 上 与 本 书 第 1 版 有 
所 不 同 ， 但 在 效果 上 是 等 价 的 。 某 些 实现 通过 将 临时 定义 的 概念 一 般 
化 而 放宽 了 这 个 限制 。 在 另 一 种 形式 中 ， 一 个 程序 中 所 有 翻译 单元 的 
外 部 连接 对 象 的 所 有 临时 定义 将 集中 进行 考虑 ， 而 不 是 在 各 翻译 单元 
中 分 别 考虑 ，UNIX 系统 通常 承 采 用 这 种 方法 ， 并 且 被 认为 是 该 标准 
的 一 般 扩 展 。 如 果 定 义 在 程序 中 的 某 个 地 方 出 现 ， 则 临时 定义 仅 被 认 
和 
0 的 定义 。 


A.11 作用 域 与 连接 


一 个 程序 的 所 有 单元 不 必 同 时 进行 编译 。 源 文件 文本 可 保存 在 在 二 个 
文件 中 ， 每 个 文件 中 可 以 包含 多 个 翻译 单元 ， 预 先 编译 过 的 例 程 可 以 


ay a a ape ner ober 
实现 。 


因此 ， 我 们 需要 考虑 两 种 类 型 的 作用 域 :第 一 种 是 标识 符 的 词法 作用 
域 ， 它 是 体现 标识 符 特 性 的 程序 文本 区 域 ;第 二 种 是 与 具有 外 部 连接 的 
对 象 和 函数 相关 的 作用 域 ， 它 决定 各 个 单独 编译 的 翻译 单元 中 标识 符 
之 间 的 连接 。 


A.11.1 词法 作用 域 


标识 符 可 以 在 铬 干 个 名 字 空 间 中 使 用 而 互 不 影响 。 如 来 位 于 不 同 的 名 
字 空 间 中 ， 即 使 是 在 同一 作用 域内 ， 相 同 的 标识 符 也 可 用 于 不 同 的 目 
的 。 名 字 空 间 的 类 型 包括 :对 象 、 函 数 、 类 型 定义 名 和 枚 举 党 量 ;标号 ; 
结构 标记 、 联 合 标 记 和 枚 举 标记 ;各 结构 或 联合 目 身 的 成 员 。 


说 明 : 这 些 规则 与 本 手册 第 1 版 中 所 述 的 内 容 有 几 点 不 同 。 以 前 标号 没 
有 目 己 的 名 字 空 间 ; 结 构 标 记 和 联合 标记 分 别 有 各 目的 名 字 空 间 ， 在 某 
些 实现 中 极 举 标记 也 有 目 己 的 名 字符 间 ; 把 不 同 种 类 的 标记 放 在 同一 名 
字 空 间 中 是 新 增加 的 限制 。 与 第 1 版 之 间 最 大 的 不 同 在 于 : 


每 个 结构 和 联合 都 为 其 成 员 建 立 不 同 的 名 字 空间 ， 因 此 同一 名 字 可 出 
现在 多 个 不 同 的 结构 中 。 这 一 规则 在 最 近 几 年 使 用 得 很 多 


在 外 部 声明 中 ， 对 象 或 函数 标识 符 的 词法 作用 域 从 其 声明 结束 的 位 置 
开始 ， 到 所 在 翻译 单元 结束 为 止 。 函 数 定义 中 形式 参数 的 作用 域 从 定 
义 函 数 的 程序 块 开始 处 开始 ， 并 贯 罕 整 个 KR, KRU H BS 
作用 域 到 声明 符 的 末尾 处 结束 。 程 序 块头 部 中 声明 的 标识 符 的 作用 域 
古 其 所 在 的 整个 程序 块 。 标 号 的 作用 域 是 其 所 在 的 钞 数 。 结 构 标 记 、 
联合 标记 、 枚 举 标记 或 枚 举 稼 量 的 作用 域 从 其 出 现在 类 型 说 明 符 中 开 
始 ， 到 翻译 单元 结束 为 止 ( 对 外 部 声明 而 言 ) 或 到 程序 块 结束 为 止 (对 函 
数 内 部 声明 而 言 )。 


如 果 某 一 标识 符 显 式 地 在 程序 块 (包括 构成 函数 的 程序 块 ) 头 部 中 声 
明 ， 则 该 程序 块 外 部 中 此 标识 符 的 任何 声明 都 将 被 挂 起 ， 直 到 程序 块 
结束 再 恢复 其 作用 。 


A.11.2 连接 


在 翻译 单元 中 ， 具 有 内 部 连接 的 同一 对 象 或 函数 标识 符 的 所 有 声明 都 
引用 同一 实体 ， 并 且 ， 该 对 象 或 函数 对 这 个 翻译 单元 来 说 是 惟一 的 。 
具有 外 部 连接 的 同一 对 象 或 函数 标识 符 的 所 有 声明 也 引用 同一 实体 ， 
并 且 该 对 象 或 画 数 是 被 整个 程序 中 共 至 的 。 


如 A.10.2 TER, WRAT static 说 明 符 ， 则 标识 符 的 第 一 个 外 部 
声明 将 使 得 该 标 识 符 具有 内 部 连接 ， 人 否则 ， 该 标识 符 将 具有 外 部 连 

接 。 如 有 果 程 序 块 中 对 一 个 标识 符 的 声明 不 包含 extern 说 明 符 ， 则 该 标 
识 符 没有 连接 ， 并 且 在 函数 中 十 惟一 的 。 如 采 这 种 声明 中 包 合 extern 
说 明 符 ， 并 且 ， 在 包含 该 程序 块 的 作用 域 中 有 一 个 该 标识 符 的 外 部 声 
明 ， 则 该 标识 符 与 该 外 部 声明 具有 相同 的 连接 ， 并 引用 同一 对 象 或 函 
数 。 但 是 ， 如 有 条 没有 可 见 的 外 部 声明 ， 则 该 连接 是 外 部 的 。 


A.12 预 处 理 
预 处 理 器 执行 宏 蔡 换 、 条 件 编译 以 及 包含 指定 的 文件 ， 以 # 开 头 的 命令 
行 (< #' 前 可 以 有 空格 ) 就 是 预 处 理 器 处 理 的 对 象 。 这 些 命令 行 的 语法 


独立 于 语言 的 其 它 部 分 ， 它 们 可 以 出 现 在 任何 地 方 ， 其 作用 可 延续 到 
所 在 翻译 单元 的 末尾 (与 作用 域 无 关 )。 行 边界 是 有 实际 意义 的 ; 每 一 行 


都 将 单独 进行 分 析 ( 有 关 如 何 将 行 连结 起 来 的 详细 信息 参见 A.12.4 
广 )。 对 预 处 理 句 而 言 ， 记 号 可 以 是 任何 语言 记号 ， 也 可 以 是 类 似 于 
#include 指令 (参见 A.12.4 廊 ) 中 表示 文件 名 的 字符 序列 ， 此 外 ， 所 有 
未 进行 其 它 定 义 的 字符 都 将 被 认为 是 记号 。 但 是 ， 在 预 处 理 需 指令 行 
中 ， 除 空格 、 横 向 制 表 符 外 的 其 它 空白 符 的 作用 是 没有 定义 的 。 


预 处 理 过 程 在 逻辑 上 可 以 划分 为 几 个 连续 的 阶段 (在 某 些 特殊 的 实现 中 
可 以 缩减 ) 。 


1) 自 完 ， 将 A.12.1 市 所 述 的 三 字符 序列 蔡 换 为 等 价 了 字符。 如 来 操作 系 
统 环境 需要 ， 还 要 在 源 文 件 的 各 行 之 间 插 入 换行 符 。 


T) 

2) 将 指令 行 中 位 于 换行 符 前 的 反 斜 杠 符 \ 删 除 掉 ， 以 把 各 指令 行 连接 起 
来 (参见 ”A.12.2 

3) 将 程序 分 成 用 空白 符 分 隔 的 记号 。 注 释 将 被 替换 为 一 个 空白 符 。 接 
着 执行 预 处 理 指令 ， 并 进行 宏 扩 展 ( 参 见 A.12.3 节 售 A.12.10 节 )。 


ARETE Fa ETAP TB EPPS SOE (BW A.2.5 市 与 A.2.6 
MEAN 等 价 字符 ， 然 后 把 相 邻 的 字符 串 字 面值 连接 起 来 。 


5) 收 集 必 要 的 程序 和 数据 ， 并 将 外 部 男 数 和 对 象 的 引用 与 其 定义 相连 
接 ， 翻 译 经 过 以 上 处 理 得 到 的 结果 ， 然 后 与 其 它 程序 和 库 连 接 起 来 。 


A.12.1 三 字符 序列 


C 语 育 源 程序 的 字符 集 是 7 位 ASCII 码 的 子 集 ， 但 它 是 ISO 646.1983 
不 变 代 码 集 的 超 集 。 为 了 将 程序 通过 这 种 缩减 的 字符 集 表示 出 来 ， 下 
列 所 示 的 所 有 三 字符 序列 都 要 用 相应 的 单个 字符 蔡 换 ， 这 种 蔡 换 在 进 
行 所 有 它 他 处 理 之 前 进行 。 


路 


除 此 之 外 不 进 
征 。 


| 


HERH o 说 明 : 三 字符 序列 是 ANSI 标准 新 引入 的 特 


A.12.2 行 连 接 


通过 将 以 反 和 斜 杠 \ 结 束 的 指令 行 末 尾 的 反 和 斜 杜 和 其 后 的 换行 符 删 除 掉 。 
可 以 将 寿 干 指令 行 合并 成 一 行 。 这 种 处 理 要 在 分 隅 记号 之 前 进行 。 


A.12.3 宏 定 义 和 扩 展 
类 似 于 下 列 形式 的 控制 指令 : 


#define 标识 符 记号 序列 FFE UB as EZ VA eh LE 
实例 用 给 定 的 记号 序列 替换 。 记 号 序列 前 后 的 空 


白 符 都 将 被 丢弃 掉 。 第 二 次 用 #define 指令 定义 同一 标识 符 是 错误 的 ， 
除非 第 二 次 定义 中 的 


标记 序列 与 第 一 次 相同 (所 有 的 空 晶 分隔 符 被 认为 是 相同 的 ) 。 
类 似 于 下 列 形式 的 指令 行 : 


define 标识 符 (标识 符 表 opt) 记号 序列 是 一 个 带 有 形式 参数 (由 标识 符 
表 指 定 ) 的 宏 定义 ， 其 中 第 一 个 标识 符 与 圆 括 号 (之 间 没有 

空格 。 同 第 一 种 形式 一 样 ， 记 号 序列 前 后 的 空白 符 都 将 被 丢弃 掉 。 如 
果 要 对 宏 进行 重 定义 ， 

则 必须 保证 其 形式 参数 个 数 、 拼 写 及 记号 序列 都 必须 与 前 面 的 定义 相 


同 


类 似 于 下 列 形式 的 控制 指令 : 


#undef 标识 符 


用 于 取消 标识 符 的 预 处 理 器 定义 。 将 #undef 应 用 于 未 知 标识 符 ( 即 未 用 
#define 指令 定义 的 标识 符 ) 并 不 会 导致 错误 。 


按照 第 二 种 形式 定义 宏 时 ， 安 标识 符 ( 后 面 可 以 跟 一 个 空白 符 ， 经 日 符 
征 可 选 的 ) 及 其 后 用 一 对 圆 括号 括 起 来 的 、 由 过 号 分 隔 的 记号 序列 束 
构成 了 一 个 安 调 用 。 安 调用 的 实际 参数 是 用 喜 号 分 隔 的 记号 序列 ， 用 
引号 或 巾 套 的 括号 括 起 来 的 逗号 不 能 用 于 分 隔 实 际 参数 。 在 处 理 过 程 
中 ， 实 际 参数 不 进行 宏 扩 展 。 宏 调用 时 ， 实 际 参数 的 数目 必须 与 定义 
中 形式 参数 的 数 目 匹 配 。 实 际 参数 被 分 离 后 ， 前 导 和 尾部 的 空 日 符 将 
被 删除 。 随 后 ， 由 各 实际 参数 产生 的 记 号 序列 将 车 换 未 用 3 引 ' 写 引起 来 
的 相应 形式 参数 的 标识 符 (位 于 宏 的 车 换 记 号 序列 中 )。 除 非 奉 换 序 列 
中 的 形式 参数 的 前 面 有 一 个 # 符 号 ， 或 者 其 前 面 或 后 面 有 一 个 挫 符 号 ， 
pe 要 对 宏 调用 的 实际 参数 记号 进行 检查 ， 并 在 必要 时 进 
IT FR ° 


BAS BPTRA DIE ELE aM SAE o A, RRC SP PASE 
个 形式 参数 表面 直 接 是 一 个 # 稚 号 (它们 之 间 没 有 空 日 符 )， 相 应 形式 参 
数 的 两 边 将 被 加 上 双 引 号 (")， 随 后 ，# 和 形式 参数 标识 符 将 被 用 引号 

引起 来 的 实际 参数 替换 。 实 际 参数 中 的 字符 串 字 面值 、 字 符 常 量 两 边 
或 内 部 的 每 个 双 引 号 (") 或 反 斜 杠 () 前 面 都 要 插入 一 个 反 斜 杠 (\)。 


其 次 ， 无 论 哪 种 宏 的 定义 记号 序列 中 包含 一 个 检 运 算 符 ， 在 形式 参数 
Se alee 其 前 后 的 空 日 符 痢 删除 挥 ， 以 便 将 相 邻 记号 连接 起 
来 形成 一 个 新 记号 。 如 果 这 样 产 生 的 记号 无 效 ， 或 者 结果 依赖 于 雁 运 
算 符 的 处 理 顺 序 ， 则 结果 没有 定义 。 同 时 ， 赫 也 可 以 不 出 现在 奉 换 记 
号 序列 的 开头 或 结尾 。 


对 这 两 种 类 型 的 安 ， 都 要 重复 扫 摘 蔡 换 记号 序列 以 查找 更 多 的 已 定义 
标识 符 。 但 是 。 当 某 个 标识 符 在 某 个 扩展 中 被 奉 换 后 ， 再 次 扫描 并 再 
次 遇 到 此 标识 符 时 不 再 对 其 执行 奉 换 ， 而 是 保持 不 变 。 

即使 执行 安 扩 展 后 得 到 的 最 终结 果 以 村 J[ 头 ， 也 不 认为 它 是 预 处 理 指 


令 。 说 明 :有 关 宏 扩展 处 理 的 细节 信息 ，ANSI 标准 比 第 1 版 描述 得 更 
详细 。 最 重要 的 变化 是 


加 入 了 # 和 和 检 运 算 符 ， 这 束 使 得 引用 和 连接 成 为 可 能 。 某 些 新 规则 ( 特 
别 征 与 连接 有 天 的 规则 ) 


比较 独特 (参见 下 面 的 例子 )。 

例如 ， 这 种 功能 可 用 来 定义 "表示 常量 "， 如 下 例 所 示 : 

#define TABSIZE 100 int table[TABSIZE]: 

定义 

#define ABSDIFF(a, b) ((a)>(b) ? (a)*(b) : (b)*(a)) 
定义 了 一 个 宏 ， 它 返回 两 个 参数 之 差 的 绝对 值 。 与 执行 同样 功能 的 孙 
数 所 不 同 的 是 ， 参 数 与 返回 值 可 以 是 任意 算术 类 型 ， 甚 至 可 以 是 指 
针 。 同 时 ， 参 数 可 能 有 副作用 ， 而 且 需 要 计算 两 次 ， 一 次 进行 测试 ， 
男 一 次 则 生成 值 。 

假定 有 下 列 定义 : 


#define tempfile(dir) #dir "%s" 


宏 调 用 tempfile(/usr/tmp) 将 生成 


"/usr/tmp" "%s" 

随后 ， 该 结果 将 被 连接 为 一 个 单个 的 字符 串 。 给 定 下 列 定义 : 

#define cat(x, y) x ##y 

那么 ， 安 调用 cat(var, 123) 将 生成 var123。 但 是 ， 宏 调用 cat(cat(1,2),3) 
a SH#BELIL TINAMAAN E ° AL, ERER RINE 
cat ( 1 ， 2 )3 

并 且 ，)3 (不 是 一 个 合法 的 记号 ， 它 由 第 一 个 参数 的 最 后 一 个 记号 与 第 
二 个 参数 的 第 一 人 1 号 连接 而 成 。 如 果 再 引入 第 二 层 的 宏 定 义 ， 如 下 
a 

#define xcat(x, y) cat(x,y) 


Bel HAY ME ERR © xcat(xcat(1, 2), 3) 将 生成 123， 因 为 xcat 
BSW NO SHA RAT ° 


类 似 地 ，ABSDIFF(ABSDIFF(a,b),c) 将 生成 所 期 户 的 经 完全 扩展 后 的 结 
果 o 


A.12.4 文件 包含 

下 列 形式 的 控制 指令 : 

#include < 文件 名 > 

Ce 替换 为 文件 名 指 定 的 文件 的 内 容 。 文 件 名 不 能 包含 > 或 换行 
。 如 果 文 件 名 中 包含 字 符 "、'、\、 或 /#， 则 其 行为 没有 定义 。 预 处 

sat 年 某 些 特定 的 位 置 查找 指定 的 文件 ， 查 找 的 位 置 与 具体 的 实现 

H 
类 似 地 ， 下 列 形式 的 控制 指令 : 
#include "文件 和 名" 


B MACE A BR Ta AE SCG IE S RA SE 
天 )， 如 果 没 有 找到 指 定 的 文件 ， 则 按照 第 一 种 定义 的 方式 处 理 。 如 
果 文 件 名 中 包含 字符 '、\、 或 六， 其 结果 仍然 是 没有 定义 的 ， 但 可 以 使 
用 字符 >。 

最 后 ， 下 列 形 式 的 指令 行 : 

#include 记号 序列 同上 述 两 种 情况 都 不 同 ， 它 将 按照 扩展 普通 文本 的 
方式 扩展 记 与 序列 进行 解释 。 记 和 号 序列 必 


人 
理 。 


#include XARJ LAKE ° 
A.12.5 条 件 编译 


对 一 个 程序 的 某 些 部 分 可 以 进行 条 件 编译 ， 条 件 编译 的 语法 形式 如 下 : 


PUC aR FF: 

放行 文本 elif 部 分 opt else 部 分 opt #endif if íT: 
#if 常量 表达 式 

#ifdef 标识 符 

#ifndef 标识 符 

elif 部 分 : 

elif 47 文本 elif 部 分 opt elif íF: 
#elif 常量 表达 式 

else 部 分 : 

else 行 文本 

else 行 : 

#else 


其 中 ， 每 个 条 件 编译 指令 (if 行 、elif 行 、else 行 以 及 #endif) 在 程序 中 均 
单独 占 一 行 。 预 处 理 器 依次 对 #if 以 及 后 续 的 #elif 行 中 的 常量 表达 式 
进行 计算 ， 直 到 发 现 某 个 指令 的 常 量 表 达 式 为 非 0 值 为 止 ， 这 时 将 放 
弃 值 为 0 的 指令 行 后 面 的 文本 。 沼 量 表达 式 不 为 0 hrif 和 #elif 指令 之 
后 的 文本 将 按照 其 它 普 通 程 序 代码 一 样 进行 编译 。 在 这 里 ，" 文 本 "十 
指 任 何 不 属于 条 件 编 译 指 令 结 构 的 程序 代码 ， 它 可 以 包含 预 处 理 指 
令 ， 也 可 以 为 空 。 一 旦 预 处 理 器 ALE Mit 或 #elif 条 件 编译 指令 中 
的 常量 表达 式 的 值 不 为 0， 并 选择 其 后 的 文本 供 以 后 的 编译 阶段 使 用 
时 ， 后 续 的 #elif 和 #else 条 件 编 译 指令 及 相应 的 文本 将 被 放弃 。 如 果 所 
有 第 量 表达 陈 的 值 都 为 0， 并且 该 条 件 编译 指令 链 中 包 侣 一 条 #else 指 
令 。 则 将 选择 #else 指令 之 后 的 文本 。 除 了 对 条 件 编译 指令 的 从 套 进 
行 检查 之 外 ， 条 件 编 译 指令 的 无 效 分 文 ( 即 条 件 值 为 假 的 分 文 ) 控 制 的 
文本 都 将 被 忽略 。 


#if 和 #elif FAYE BAIA LUT IS HA AR o FFA, CECA FIE 
MIRISA: 


defined 标识 符 或 
Defined( 标 识 符 ) 


都 将 在 执行 宏 扫 摘 之 前 进行 奉 换 ， 如 采 该 标识 符 在 预 处 理 融 中 已 经 定 
X, WA1 ARE, T 

则 ， 用 0 蔡 换 。 预 处 理 需 进行 安 扩 展 之 后 仍然 存在 的 任何 标识 符 都 将 
用 o REH o Ba, 

MEA E EA ae A N LR Aa Sk L, MEENAAZ 
运算 都 当 作 是 在 长 整 型 或 无 符号 长 整 型 的 操作 数 之 间 进 行 的 运算 。 


进行 上 述 处 理 之 后 的 种 量 表达 式 (参见 A719 市) 满足 下 列 限制 条 
件 : 它 必 须 是 整 型 ， 并 且 其 中 不 包含 sizeof、 强 制 类 型 转换 运算 符 或 枚 


下 列 控制 指令 : 
#ifdef 标识 蒋 

#ifndef 标识 符 分 别 等 价 于 : 

#if defined 标识 符 

#if ldefined 标识 符 

说 明 :#elif 是 ANSI 中 新 引入 的 条 件 编译 指令 ， 但 此 前 它 已 经 在 某 些 预 
0 
A.12.6 行 控 制 

为 了 便于 其 它 预 处 理 器 生成 C 语言 程序 ， 下 列 形式 的 指令 行 : 

#line 常量 "文件 名 " 


#ine 常量 将 使 编译 器 认为 (出 于 错误 诊断 的 目的 ): 下 一 行 源 代码 的 行 号 
征 以 十 进 制 整 型 常量 的 形式 给 


出 的 ， 并 且 ， 当 前 的 输入 文件 是 由 该 标识 符 命 名 的 。 如 果 缺 少 带 双 引 
号 的 文件 名 部 分 ， 则 将 


ee o 行 中 的 宏 将 移 进行 扩展 ， 然 后 再 进 
行 解 释 。 


A.12.7 错误 信息 生成 

下 列 形式 的 预 处 理 器 控制 指令 : 

#error 记号 序列 opt 

将 使 预 处 理 器 打印 包含 该 记号 序列 的 诊断 信息 。 


A.12.8 pragma 


下 列 形式 的 控制 指令 : 
#pragma 记号 序列 opt 


将 使 预 处 理 器 执行 一 个 与 具体 实现 相关 的 操作 。 无 法 识别 的 
pragma( 编 译 指示 ) 将 被 忽略 掉 。 


A.12.9 空 指 令 
下 列 形式 的 预 处 理 器 行 不 执行 任何 操作 : 


# 


A.12.10 预 定义 名 字 


某 些 标 识 符 是 预定 义 的 ， 扩 展 后 将 生成 特定 的 信息 。 它 们 同 预 处 理 右 
表达 式 运 算 符 


defined 一 样 ， 不 能 取消 定义 或 重新 进行 定义 。 


LINE 


FILE 

DATE 

TIME 

STDC 

包含 当前 源 文件 行 数 的 十 进 制 常 量 。 包 含 正在 被 编译 的 源 文件 名 字 的 
字符 串 字 面值 。 包含 编译 日 期 的 字符 串 字 面值 ， 其 形式 为 < Mmm dd 
Yyyy" ”包含 编 详 时 间 的 字符 串 字 面值 ， 其 形式 为 “hh:mm:ss"。 整 型 
常量 1。 只 有 在 遵循 标准 的 实现 中 该 标识 符 才 被 定义 为 1。 
说 明 :#error 与 #pragma 是 ANSI 标准 中 新 引入 的 特征 。 这 些 预 定义 的 


预 处 理 絮 宏 也 是 新 引入 的 ， 其 中 的 一 些 安 先 前 已 经 在 某 些 编译 大 中 实 
现 。 


A.13 wik 


这 一 部 分 的 内 容 将 简要 概述 本 附 邓 前 面部 分 中 讲述 的 语法 。 它 们 的 内 
容 完 全 相同 ， 但 顺序 有 一 些 调整 。 


本 语法 没有 定义 下 列 终结 符 : 整 型 常量 、 字 符 常 量 、 浮 点 常量 、 标 识 
符 、 字 符 串 和 枚 举 常量 。 以 打字 字体 形式 表示 的 单词 和 符号 古 终 结 
符 。 本 语法 可 以 直接 转换 为 目 动 语法 分 析 程 序 生成 磺 可 以 接受 的 输 
入 。 除 了 增加 语法 记号 说 明 产 生 式 中 的 候选 页 外 ， 还 需要 扩展 其 中 的 
“one of 结构 ， 并 (根据 语法 分 析 程 序 生成 璐 的 规则 ) 复 制 每 个 珊 有 opt 
符号 的 产生 式 :一 个 带 有 opt 符号 ， 一 个 没有 opt 符号 。 这 里 还 有 一 个 
变化 ， 即 删除 了 产生 式 " 类 型 定义 名 : 标识 符 "， 这 样 束 使 得 其 中 的 类 型 


定义 名 成 为 个 终结 符 。 该 语法 可 被 YACC 语法 分 析 程 序 生 成 ae BERS 
但 由 于 if*else 的 歧义 性 问题 ， 还 存在 一 处 冲突 。 


翻译 单元 

外 部 声明 

翻译 单元 外 部 声明 外 部 声明 : 

函数 定义 声明 

函数 定义 : 

声明 说 明 符 opt 声明 符 声 明 表 opt 复合 语句 声明 : 
声明 说 明 符 初始 化 声明 符 表 opt; 

声明 表 : 


声明 


声明 表 声明 
声明 说 明 符 : 


存储 类 说 明 符 声明 说 明 符 opt 类 型 说 明 符 声明 说 明 符 opt 类 型 限定 符 
声明 说 明 符 opt 


存储 类 说 明 符 :one of 
auto register static extern tyedef 
类 型 说 明 符 :one of 


void char short int long float double signed unsigned 结构 或 联合 说 明 符 
枚 举 说 明 符 类 型 定义 名 


类 型 限定 符 :one of 

const volatile 

结构 或 联合 说 明 符 : 

结构 或 联合 标识 符 opt {结构 声明 表 } 
结构 或 联合 标识 符 结构 或 联合 :one of 
struct union 

结构 声明 表 : 

结构 声明 

结构 声明 表 结构 声明 初始 化 声明 符 表 
初始 化 声明 符 

初始 化 声明 符 表 , 初始 化 声明 符 初始 化 声明 符 : 


声明 符 声明 符 = 初 始 化 符 


结构 声明 : 
说 明 符 限定 符 表 结构 声明 符 表 ; 说 明 符 限定 符 表 : 


类 型 说 明 符 说 明 符 限定 符 表 opt 


类 型 限定 符 说 明 符 限定 符 表 opt 
结构 声明 符 表 : 结构 声明 符 

结构 声明 符 表 , 结构 声明 符 结构 声明 符 : 
声明 符 

声明 符 opt: 常量 表达 式 牧 举 说 明 符 
enum 标识 符 opt { 枚 举人 符 表 } enum 标识 符 
枚 举 符 表 : 

枚 举 符 

枚 举 符 表 , 枚 举 符 枚 举 符 

标识 符 标识 符 = 常 量 表达 式 

声明 符 

指针 opt 直接 声明 符 直接 声明 符 : 


标识 和 从 


(声明 符 ) 直接 声明 符 [常量 表达 式 ] 直接 声明 符 (形式 参数 类 型 表 ) 直接 


声明 符 ( 标 识 符 表 opt) 
HET: 
* 类 型 限定 符 表 opt 
* 类 型 限定 符 表 opt 指针 类 型 限定 符 表 : 
类 型 限定 符 


类 型 限定 符 表 类 型 限定 符 


形式 参数 类 型 表 : 
形式 参数 表 形式 参数 表 ,.… 
形式 参数 表 : 
形式 参数 表 声 明 形式 参数 表 , 形式 参数 声明 
形式 参数 声明 : 声明 说 明 符 声明 符 
声明 说 明 符 抽象 声明 符 opt 
标识 符 表 : 
标识 符 
标识 符 表 , 标识 符 初 值 : 
赋值 表达 式 
{ 初 值 表 } 
{ 初 值 表 , } 
初 值 表 : 
初 值 
初 值 表 , 初 值 类 型 名 : 
说 明 符 限定 符 表 抽象 声明 符 opt 
抽象 声明 符 : 指针 
HET opt 直接 抽象 声明 符 直接 抽象 声明 符 : 
(抽象 声明 符 ) 
直接 抽象 声明 符 opt [常量 表达 式 ] 


直接 抽象 声明 符 opt (形式 参数 类 型 表 opt) 
类 型 定义 名 : 


标识 和 从 


BA: 
带 标 号 语句 表达 式 语 句 复合 语句 选择 语句 循环 语句 跳 转 语句 


市 标号 语句 : 


标识 符 : 语句 

case 常量 表达 式 语句 

dafault: 语句 表达 式 语 句 ; 
表达 式 opt; 

复合 语句 : 

{ 声 明 表 opt 语句 表 opt} 
语句 表 : 

语句 

语句 表 语句 选择 语句 : 

if (表达 式 ) 语句 

if (表达 式 ) 语句 else 语句 
switch (表达 式 ) 语句 循环 语句 
while (表达 式 ) 语句 

do 语句 while (表达 式 ); 

for (表达 式 opt; 表达 式 opt; 表达 式 opt) 语句 跳 转 语句 ]: 


goto 标识 符 ; continue; 


break; 


return 表达 式 opt; 

表达 式 : 

赋值 表达 式 

表达 式 , 赋值 表 选 式 赋值 表达 式 : 

AAP RIAL 

一 元 表达 式 赋值 运算 符 赋值 表达 式 赋值 运算 符 :one of 


= *= /= I= += 。= <<= >>= &= ^= |= 


辑 或 表达 式 或 表达 式 ?表达 式 : 条 件 表达 式 


ak Ri 
val 
vit 
DE 
H 


aR 
T 
兹 
St 
2 
R 
tin 
yal 
兹 
St 
2 


逻辑 与 表达 式 

接 位 或 表达 式 逻辑 与 表达 式 && 按 位 或 表达 式 
按 位 或 表达 陈 : 按 位 寞 或 表达 式 

按 位 或 表达 式 | 按 位 异 或 表达 式 接 位 异 或 表达 式 : 
按 位 与 表达 式 接 位 异 或 表达 式 ^ 按 位 与 表达 式 
按 位 与 表达 式 : 相等 类 表达 式 

按 位 与 表达 式 & 相 等 类 表达 式 相等 类 表达 式 : 


相等 类 表达 式 == 关 系 表达 式 相等 类 表达 式 != 天 系 表达 式 
关系 表达 式 : 


移 位 表达 式 关系 表达 式 < 移 位 表达 式 关系 表达 式 > 移 位 表达 式 RAK 
达 式 <= 移 位 表达 式 , 关系 表达 式 >= 移 位 表达 式 


移 位 表达 式 
加 法 类 表达 式 移 位 表达 式 << 加 法 类 表达 式 移 位 表达 式 >> 加 法 类 表达 


F 
加 法 类 表达 式 : 乘法 类 表达 式 

加 法 类 表达 式 + 乘 法 类 表达 式 加 法 类 表达 式 . 乘 法 类 表达 式 
乘法 类 表达 式 ;: 强制 类 型 转换 表达 式 类 表达 式 * 强 制 类 型 转换 表达 式 
来 法 类 表达 点 /强制 类 型 我 换 表 达 式 乘法 类 表达 式 % 强 制 类 型 转换 表达 


强制 类 型 转换 表达 式 ;: 一 元 表达 式 

(类 型 名 ) 强 制 类 型 转换 表达 式 一 元 表达 式 : 

后 弘一 元 式 

tt 

"一 元 表达 式 一 元 运算 和 从 强制 类 型 转换 表达 式 


sizeof 一 元 表达 式 
sizeof( 类 型 名 ) 

一 元 运算 符 :one of 
Re ten! 
后 缀 表达 式 : 


初等 表达 式 后 级 表达 式 [ 表 达 式 ] 后 级 表达 式 (参数 表达 式 表 opt) 后 绥 
表达 式 .标识 符 后 缀 表达 式 。> 标 识 符 后 缀 表达 式 ++ 


后 级 表达 式 … 初等 表达 式 : 


参数 表达 式 表 , 赋值 表达 式 Fi: 
整 型 音量 字符 常量 浮 点 常量 BCS E 

下 列 预 处 理 厦 语法 总 结 了 控制 指令 的 结构 ， 但 不 适合 于 机 械 化 的 语法 
分 析 。 其 中 包含 符 号 "文本 "( 即 通常 的 程序 文本 )、 非 条 件 预 处 理 絮 控 
制 指令 或 完整 的 预 处 理 器 条 件 结 构 。 

控制 指令 


=define 标识 符 记号 序列 


=define 标识 符 ( 标 识 符 表 opt) 记号 序列 


#undef 标识 和 从 

#include < 文件 名 > 

#include "文件 各" 

#include 记号 序列 

#line 常量 "文件 名 " 

#line 常量 

#error 记号 序列 。 

#pragma 记号 序列 。 

# 

FUR a TES TOUR RIFTS: 
if ÍT 文本 elif 部 分 opt else 部 分 opt #endif if ÍT: 
#if 常量 表达 式 

#ifdef 标识 符 

#ifndef 标识 符 

elif 部 分 : 

elif 47 文本 elif 部 分 opt elif íF: 

#elif 常量 表达 式 

else 部 分 : 

else 行 文本 


else 行 : 


#else 


附录 B 标准 库 


本 附 永 总 结 了 ANSI 标准 定义 的 男 数 库 。 标 准 库 不 是 C 语言 本 喘 的 构 
成 部 分 ， 但 是 文 持 标准 C 的 实现 会 提供 该 画 数 库 中 的 函数 声明 、 类 型 
以 及 安定 义 。 在 这 部 分 内 容 中 ， 我 们 省 略 了 一 些 使 用 比较 受 限 的 函数 
以 及 一 些 可 以 通过 其 它 男 数 簿 单 合 成 的 画 数 ， 也 省 略 了 多 字 季 字符 的 
内 容 ， 同 时 ， 也 不 准备 讨论 与 区 域 相关 的 一 些 属性 ， 也 束 星 与 本 地 语 
言 、 国 籍 或 文化 相 天 的 属性 。 


标准 库 中 的 函数 ， 类 型 以 及 安 分 别 在 下 面 的 标准 头 文件 中 定义 : 


easet kion ` <ai> sh i 


cpt nis sip te <string.h> 
<errno.h> Ae sia [to <time.h> 


可 以 通过 下 列 方式 访问 头 文件 : 
#include < 头 文 件 > 
头 文 件 的 包含 顺序 是 任意 的 ， 并 可 包含 任意 多 次 。 头 文件 必须 被 包含 


在 任何 外 部 声明 或 定义 之 外 ， 并 且 ， 必 须 在 使 用 头 文件 中 的 任何 声明 
之 前 包含 头 文件 。 头 文件 不 一 定 是 一 个 源 文件 。 

以 下 划 线 开头 的 外 部 标识 符 保 留 给 标准 库 使 用 ， 同 时 ， 其 它 所 有 以 一 
个 下 划 线 和 一 个 大 写字 母 开 头 的 标识 符 以 及 以 两 个 下 划 线 开头 的 标识 
符 也 都 保留 给 标准 库 使 用 。 


B.1 输入 与 输出 :<stdio.h> 


头 文件 <stdio.h> 中 定义 的 输入 和 输出 函数 、 类 型 以 及 安 的 数目 几乎 占 
整个 标准 库 的 三 分 之 一 。 


流 (stream) 是 与 磁盘 或 其 它 外 围 设 备 关 联 的 数据 的 源 或 目的 地 。 尽 管 在 
某 些 系统 中 (如 在 著名 的 UNIX 系统 中 )， 文 本 流 和 二 进 制 流 是 相同 

的 ， 但 标准 库 仍 然 提 供 了 这 两 种 类 型 的 流 。 文本 流 是 由 文本 行 组 成 的 
序列 ， 每 一 行 包含 0 个 或 多 个 字符 ， 并 以 \n' 结尾 。 在 某 些 环境 中 ， 

可 能 需要 将 文本 流转 换 为 其 它 表 示 形 式 (例如 把 \n' 映 射 成 回 车 符 和 换行 
符 )， 或 从 其 它 表 示 形式 转换 为 文本 流 。 二 进 制 流 是 由 未 经 处 理 的 字 
万 构成 的 序列 ， 这 些 字 和 记录 着 内 部 数据 ， 并 具有 下 列 性 质 : 如 果 在 同 
一 系统 中 写 入 二 进 制 流 ， 然 后 再 读 取 该 二 进 制 流 ， 则 读 出 和 写 入 的 内 
容 完全 相同 。 

打开 一 个 流 ， 将 把 该 流 与 一 个 文件 或 设备 连接 起 来 ， 关 闭 流 将 断 开 这 
种 连接 ， 打 开 一 个 文件 将 返回 一 个 指 回 FILE 类 型 对 象 的 指针 ， 该 指 
针 记 录 了 控制 该 流 的 所 有 必要 信息 ， 在 不 引 起 歧义 的 情况 下 ， 我 们 在 
下 文中 将 不 再 区 分 "文件 指针 "和 " 流 "。 


程序 开始 执行 时 ，stdin、stdout 和 stderr 这 3 个 流 已 经 处 于 打开 状态 。 


B.1.1 文件 操作 


下 列 函 数 用 于 处 理 与 文件 有 关 的 操作 。 其 中 ， 类 型 size t 是 由 运算 从 
sizeof 生成 的 无 符号 整 型 。 


FILE *fopen(const char *filename, const char *mode) 


fopen 函数 打开 filename 指定 的 文件 ， 并 返回 一 个 与 之 相关 联 的 流 。 如 
果 打 开 操 作 失 败 ， 则 返回 NULL ° 


访问 模式 mode 可 以 为 下 列 合 法 值 之 一 : 
mi 打开 文本 文件 用 于 读 


"w，” ”创建 文本 文件 用 于 写 ， 并 删除 已 存在 的 内 容 ( 如 果 有 的 话 ) 

"a"” ”追加 ;打开 或 创建 文本 文件 ， 并 向 文件 末尾 追加 内 容 

"r+" ”打开 文本 文件 用 于 更 新 ( 即 读 和 写 ) 

Ww” 创建 文 本 文件 用 于 更 新 。 并 删除 已 存在 的 内 容 (如 果 有 的 

话 ) 

‘ae 记 加 ;打开 或 创建 文本 文件 用 于 更 新 ， 写 文件 时 追加 到 文件 
毛 


后 3 种 方式 (更 新 方式 ) 允 许 对 同一 文件 进行 读 和 写 。 在 读 和 写 的 交叉 

过 程 中 ， 必 须 调 用 fflush 函数 或 文件 定位 函数 。 如 果 在 上 述 访问 模式 
之 后 再 加 上 b， 如 “rb" 或 “w+b" 等 ， 则 表示 对 二 进 制 文件 进行 操作 。 

文件 名 filename 限定 最 多 为 FILENAME_MAX 个 字符 。 一 次 最 多 可 

打开 FOPEN_MAX 个 文件 。 


FILE *freopen(const char *filename, const char *mode, FILE *stream) 
freopen 函数 以 mode 指定 的 模式 打开 filename 指定 的 文件 ， 并 将 该 文 
件 天 联 到 


stream 指定 的 流 。 它 返回 stream; Æ BARE] NULL ° Freopen 函数 
一 般 用 于 改变 与 


stdin ` stdout 和 stderr 相关 联 的 文件 。 
int fflush(FILE *stream) 


对 输出 流 来 说 ，fflush 函数 将 已 写 到 缓冲 区 但 尚未 写 入 文件 的 所 有 数 
据 写 到 文件 中 。 对 输入 流 来 说 ， 其 结果 是 未 定义 的 。 如 果 在 写 的 过 程 
中 发 生 错误 ， 则 返回 EOF， 否 则 返回 0。fflush(NULL) 将 清洗 所 有 的 
输出 流 。 

int fclose(FILE *stream) 


fclose 函数 将 所 有 未 写 入 的 数据 写 入 stream F, AFP PAPA 
未 读 输 入 数据 ， 并 释放 目 动 分 配 的 全 部 缓冲 区 ， 最 后 关闭 流 。 若 出 错 
则 返回 EOF, ANKE] O° 


int remove(const char *filename) 


remove 函数 删除 filename 指定 的 文件 ， 这 样 ， 后 续 试 图 打开 该 文件 的 
操作 将 失败 。 如果 删除 操作 失败 ， 则 返回 一 个 非 0 值 。 


int rename(const char *oldname, const char *newname) rename 函数 修改 


文件 的 名 字 。 如 宋 操作 失败 ， 则 返回 一 个 非 0 值 。 

FILE *tmpfile(void) 

tmpfile 函数 以 模式 "wb+" 创 建 一 个 临时 文件 ， 该 文件 在 被 关闭 或 程序 
正常 结束 时 将 被 目 动 删除 。 如 采 创 建 操作 成 功 ， 该 函数 返回 一 个 流 ;如 
采 创 建文 件 失败 ， 则 返回 NULL ° 


char *tmpnam(char s[L_tmpnam]) 


tmpnam(NULID) 函 数 创 建 一 个 与 现 有 文件 名 不 同 的 字符 串 ， 并 返回 一 
个 指向 一 内 部 静态 数组 的 指针 。tmpnam(S) 函 数 把 创建 的 字符 串 保 存 
到 数组 s 中 ， 并 将 它 作为 函数 值 返 回 。s 中 至 少 要 有 L_tmpnam 个 字符 
的 空间 。Tmpnam 函数 在 每 次 被 调用 时 均 生 成 不 同 的 名 字 。 在 程序 执 
行 的 过 程 中 ， 最 多 只 能 确保 生成 TMP_MAX 个 不 同 的 名 字 。 注 意 ， 
tmpnam RAY REH 于 创建 一 个 名 字 ， 而 不 是 创建 一 个 文件 。 


int setvbuf(FILE *stream, char *buf, int mode, size_t size) 

setvbuf 函数 控制 流 stream 的 缓冲 。 在 执行 读 、 写 以 及 其 它 任 何 操作 之 
前 必须 调用 此 函数 。 当 mode 的 值 为 IJOFBF 时 ， 将 进行 完全 缓冲。 
当 mode 的 值 为 _IOLBF 时 ， 将 对 文本 文件 进行 行 缓冲 ， 当 mode 的 值 
为 JONBF F, ERDER o WR buf 的 值 不 是 NULL， 则 
setvbuf 函数 将 buf 指 同 的 区 域 作 为 流 的 缓 神 区 ， 否 则 将 分 配 一 个 缓冲 
让 o size 决定 缓 冲 区 的 长 度 。 如 果 setvbuf 函数 出 错 ， 则 返回 个 一 非 0 


void setbuf(FILE *stream, char *buf) 


如 果 buf AEA NULL ， 则 关 闭 流 stream 的 缓冲 ;否则 setbuf 函数 等 
MT 


(void)setvbuf(stream, buf, _IOFBF, BUFSIZ) ° 
B.1.2 格式 化 输出 

printf 函数 提供 格式 化 输出 转换 。 

int fprintf(FILE *stream, const char *format, ...) 


fprintf 函数 按照 format 说 明 的 格式 对 输出 进行 转换 ， 并 写 到 stream 流 
中 。 返 回 值 是 实际 写 入 的 字符 数 。 阁 出 错 则 返回 一 个 人 负 值 。 


格式 串 由 两 种 类 型 的 对 象 组 成 :普通 字符 (将 被 复制 到 输出 流 中 ) 与 转换 
说 明 ( 分 别 决定 下 一 后 续 参 数 的 转换 和 打印 )。 每 个 转换 说 明 均 以 字 
符 % 开 头 ， 以 转换 字符 结束 。 在 % 与 转换 字符 之 间 可 以 依次 包括 下 列 


内 容 : 


标志 (可 以 以 任意 顺序 出 现 )， 用 于 修改 转换 说 明 
指定 被 转换 的 参数 在 其 字段 内 左 对 齐 

$ 指定 在 输出 的 数 前 面 加 上 正人 负 号 

空格 如 果 第 一 个 字符 不 是 正 负 号 ， 则 在 其 前 面 加 上 一 个 空格 


0 对 于 数值 较 换 ， 当 输出 长 度 小 于 字段 宽度 时 ， 添 加 前 导 0 进 
行 填充 


# 指定 为 一 种 输出 形式 。 如 果 为 o 转换 ， 则 第 一 个 数字 
AMARA x BCX 转换 ， 则 指定 在 输出 的 非 0 值 前 加 Ox 或 0X; 对 于 
e、E、f、g 或 G 和 转换， 指定 输出 总 包括 一 个 小 数 点 ;对 于 g 或 G 转 
换 ， 指 定 输出 值 尾 部 无 意义 的 0 将 被 保留 


一 个 数值 ， 用 于 指定 最 小 字段 宽度 。 转 换 后 的 参数 输出 宽度 
至 少 妥 达到 这 个 数值 。 如 果 参 数 的 字符 数 小 于 此 数值 ， 则 在 参数 宽 边 
(如 有 果 要 求 左 对 齐 的 话 则 为 右边 ) 填 


殉 一 些 字符 。 填 充 字 符 通常 为 空格 ,但 是 ， 如 来 设置 了 0 填充 标志 ， 
则 填充 字符 为 0。 

点 号 ， 用 于 分 隔 字段 宽度 和 精度 。 

表示 精度 的 数 。 对 于 字符 串 ， 它 指定 打印 的 字符 的 最 大 个 数 ; 
对 于 e、 玉 或 转换 ， 它 指定 打印 的 小 数 点 后 的 数字 位 数 ; 对 于 g 或 G 
转换 ， 它 指定 打印 的 有 效 数 子 位 数 ; 


对 于 整 型 数 ， 它 指定 打印 的 数字 位 数 (必要 时 可 加 填充 位 0 以 达到 要 
求 的 宽度 ) 。 


长 度 修 饰 符 h > 1 BCL ° h 表示 将 相应 的 参数 按 short 或 
unsigned short 类 型 输 


出 。1 表示 将 相应 的 参数 按 long 或 unsigned long 类 型 输出 ;L 表示 将 相 
应 的 参 BFE long double 类 型 输出 。 


宽度 和 精度 中 的 任何 一 个 或 两 者 都 可 以 用 * 指 定 ， 这 种 情况 下 ， 该 值 将 
通过 转换 下 一 个 参数 计算 得 到 (下 一 个 参数 必须 为 int RW) o 


表 Bel 中 列 出 了 这 些 转换 字符 及 其 意义 。 如 采 % 后 面 的 字符 不 是 转换 
字符 ， 则 其 行为 没有 定义。 


K Be1 printf 函数 的 转换 字符 


ay 


换 字 符 参数 类 型 ;转换 结 采 
“int; 有 符号 十 进 制 表示 


unsigned int; 无 符号 八进制 表示 


“x unsigned int; 无 符号 十 六 进 制 表示 (没有 前 导 Ox BLOX), MAE 
0x， 则 使 用 abcdef, WRÆ 0X， 则 使 用 ABCDEF 


int; 无 符号 十 进 制 表示 
int; 转 换 为 unsigned char 类 型 后 为 一 个 字符 


char*: 打 印字 符 串 中 的 字符 ， 直 到 遇 到 "0 或 已 打印 了 由 精度 指定 
的 字符 数 

double: 形 式 为 [JJmmm.ddd 的 十 进 制 表示 ， 其 中 ，d 的 数目 由 精度 
确 确定 ， 默 认 精度 为 6。 精 度 为 0 时 不 输 出 小 数 点 


eE double: 形式 为 [*:]jm.dddddd e +xx 或 [jm.dddddd E +xx ° d 的 数目 
由 精度 确定 ， 默 认 精 度 为 6。 精度 为 0 时 不 输出 小 数 点 


8.6 double; 当 指数 小 于 。4 或 大 于 等 于 精度 时 ， 采 用 %e 或 %E 的 格 
Tl, AMIR AE 的 格式 。 尾 部 的 0 和 小 数 点 不 打印 


” ”void *; 打 印 指针 值 (具体 表示 方式 与 实现 有 关 ) 


int *; 到 目前 为 止 ， 此 printf 调用 输出 的 字符 的 数目 将 被 写 入 到 相 
应 参数 中 。 不 进行 参数 转换 


不 进行 参数 转换 ;打印 一 个 符号 % 
int printf(const char *format, ...) printf(..) 函 数 等 价 于 fprintf(stdout, ...) ° 
int Sprintf(char *s, const char *format, ...) 


sprintf KAS printf 函数 基本 相同 ， 但 其 输出 将 被 写 入 到 字符 串 s 中 ， 
并 以 \0' 结束 。s 必须 足够 大 ， 以 足够 容纳 下 输出 结 采 。 该 函数 返回 实 
际 输出 的 字符 数 ， 不 包括 \0'。 


int vprintf(const char *format, va_list arg) 


int vfprintf(FILE *stream, const char *format, va_list arg) int vsprintf(char 
*s, const char *format, va_list arg) 


vprintf ` vfprintf ` vsprintf 这 3 个 函数 分 别 与 对 应 的 printf 函数 等 价 ， 
但 它们 用 arg E T RSR ° arg 由 宏 va_start 初始 化 ， 也 可 能 由 
va_arg 调用 初始 化 。 详细 信息 参见 B.7 节 中 对 <stdarg.h> 头 文件 的 讨 


论 。 


B.1.3 格式 化 输入 

scanf 函数 处 理 格式 化 输入 转换 。 

int fscanf(FILE *stream, const char *format, ...) 

fscanf FRBUORERS SUB format 从 流 stream 中 读 取 输入 ， 并 把 转换 后 的 
值 赋值 给 后 续 各 个 参数 ， 其 中 的 每 个 参数 都 必须 是 一 个 指针 。 当 格式 
串 format HRT, KORE o A 果 到 达 文 件 的 末尾 或 在 转换 输入 前 出 
人 


格式 第 format 通常 包括 转换 说 明 ， 它 用 于 指导 对 输入 进行 解释 。 格 式 
字符 串 中 可 以 包含 下 列 页 目 : 


空格 或 制 表 符 


全 
普通 字符 (% 除 外 )， 它 将 与 输入 流 中 下 一 个 非 空 日 字符 进行 匹 


配 


转换 说 明 ， 由 一 个 %、 一 个 赋值 屏蔽 字符 *( 可 选 )、 一 个 指定 
最 大 字段 宽度 的 数 (可 选 )、 一 个 指定 目标 字段 宽度 的 字符 L) 
(可 选 ) 以 及 一 个 转换 字符 组 成 。 


转换 说 明 决 是 了 下 一 个 输入 字段 的 转换 方式 。 通 党 结 采 将 被 保存 在 由 
对 应 参数 指向 的 变 量 中 。 但 是 ， 如 采 转 换 阅 明 中 包含 赋值 屏蔽 字符 
*， 例 如 %*s， 则 将 跳 过 对 应 的 输入 了 字段， 并 不 进行 赋值 。 输 入 字段 时 
一 个 由 非 空 日 符 子 符 组 成 的 字符 串 ， 当 站 到 下 一 个 空 日 符 或 达到 最 大 
字段 宽度 (如 采 有 的 话 ) 时 ， 对 当前 输入 字段 的 读 取 绪 束 。 这 意味 着 ， 
scanf 函数 可 以 路 越 行 的 边界 读 取 输 入 ， 因 为 换行 符 也 是 空 日 符 ( 空 日 
和 从 包括 空格 、 横 向 制 表 符 、 纵 向 制 表 符 、 换 行 符 、 回 车 符 和 换 页 
Be 


转换 字符 说 明了 对 输入 字段 的 解释 方式 。 对 应 的 参数 必须 是 指针 。 合 
法 的 转换 字符 如 表 


Be2 所 示 。 


如 果 参 数 是 指向 short 类 型 而 非 int 类 型 的 指针 ， 则 在 转换 字符 d、i、 
n、o0、u 和 Xx 之 前 可 以 加 上 前 级 h。 如 果 参 数 是 指向 long 类 型 的 指 
针 ， 则 在 这 几 个 转换 字符 前 可 以 加 上 字 母 1。 如 条 参 数 是 指 网 double 
类 型 而 非 float 类 型 的 指针 ， 则 在 转换 字符 e、f 和 gg 前 可 以 加 上 字母 
1。 如 采 参 数 是 指 癌 long double 类 型 的 指针 ， 则 在 转换 子 符 e、f 和 8g 
前 可 以 加 上 字母 L。 


K Be2 scanf 函数 的 转换 宇 符 


ay 
换 字符 输入 数据 ;参数 类 型 


” 十进制 整数 ;int* 


整 型 数 ;int *。 该 整 型 数 可 以 是 八进制 (以 0 开头 ) 或 十 六 进 制 (以 Ox 
或 OX 开头 ) 


八进制 整 型 数 (可 以 这 或 不 市 前 导 0); int * 
无 符号 十 进 制 整 型 数 ;unsigned int * 


十 六 进 制 整 型 数 (可 以 市 或 不 带 前 导 Ox 或 OX);int * 


”字符 ;char*， 按 照 字 段 宽 度 的 大 小 把 读 取 的 字符 保存 到 制定 的 数 
组 中 ， 不 增加 \0 字 段 宽度 的 默认 值 为 1。 在 这 种 情况 下 ， 读 取 输 入 时 
将 不 跳 过 空白 符 。 如 果 需 要 读 入 下 一 个 非 空 白 符 ， 可 以 使 用 %1s 


由 非 空 日 符 组 成 的 字符 串 (不 包含 引号 );char *， 它 指向 一 个 字符 
数组 ， 该 字符 数组 必须 有 足够 空间 ， 以 保存 该 字符 串 以 及 在 尾部 添加 
的 \0' 字 符 


© FARE, float *。Float 类 型 浮 点 数 的 输入 格式 为 :一 个 可 选 的 正 负 
号 、 一 个 可 能 包含 小 数 点 的 数字 串 ， 


个 可 选 的 指数 字段 (字母 e 或 上 后 跟 一 个 可 能 带 正 负 号 的 整 型 数 ) 
”printf("%p") 芳 数 调 用 打印 的 指针 值 ;void * 


将 到 目前 为 止 该 男 数 调用 读 取 的 字符 数 写 入 对 应 的 参数 中 ;int * © 
部 读 取 输入 子 符 。 不 增加 已 转换 的 页 目 计数 


“1 与 方 括号 中 的 字符 集合 匹配 的 输入 字符 中 最 长 的 非 空 字符 串 ;char 
*。 末 尾 将 添加 \0'。[]...] 表 示 集 合 PAS TH)” 


“1 与 方 括号 中 的 字符 集合 不 匹配 的 输入 字符 中 最 长 的 非 空 字 符 
char *。 末 尾 将 添加 \0'。[ 和 ...] 表 示 集合 中 不 包含 字符 “了 


表示 “%"， 不 进行 赋值 
int scanf(const char *format, ...) scanf(... aS fscanf(stdin, ...) 相 同 。 
int sscanf(const char *s, const char *format, ...) 


sscanf(s, ...) 国 数 与 scanf(...) 等 价 ， 所 不 同 的 是 ， 前 者 的 输入 字符 来 源 
于 字符 E so 


B.1.4 字符 输入 /输出 函数 
int fgetc(FILE *stream) 


fqetc 函数 返回 stream 流 的 下 一 个 字符 ， 返 回 类 型 为 unsigned char 
转换 为 int 


类 型 )。 如 果 到 达 文 件 末尾 或 发 生 错 识 ， 则 返回 EOF ° 
char *fgets(char *s, int n, FILE *stream) 
fgets 函数 最 多 将 下 nel 个 字符 读 入 到 数组 s 中 。 当 遇 到 换行 符 时 ， 把 


换行 符 读 入 到 数组 s 中 ， 读 取 过 程 终 止 。 数 组 s 以 \0' 结 尾 。fgets 函数 
返回 数组 s。 如果 到 达 文 件 的 末尾 或 发 生 错误 ， 则 返回 NULL 。 


int fputc(int c, FILE *stream) 


fputc 函数 把 字符 c( 转 换 为 unsigned char 类 型 ) 输 出 到 流 stream 中 。 它 
返回 写 入 的 字符 ， 若 出 错 则 返回 EOF 。 


int fputs(const char *s, FILE *stream) 


fputs 函数 把 字符 串 s( 不 包含 字符 \n") 输 出 到 流 Btream 中 ; 它 返 回 一 个 非 
负 值 ， 者 出 错 则 返回 EOF 。 


int getc(FILE *stream) 


getc 函数 等 价 于 fgetc， 所 不 同 的 是 ， 当 getc 函数 定义 为 宏 时 ， 它 可 能 
多 次 计算 


stream 的 值 。 
int getchar(void) 


getchar 函数 等 价 于 getc(stdin) ° 


char *gets(char *s) 

gets 函数 把 下 一 个 输入 行 读 入 到 数组 s 中 ， 并 把 末尾 的 换行 人 符 蔡 换 为 
字符 \0'。 它 返 回 数组 s， 如 采 到 达 文 件 的 末尾 或 发 生 错误 ， 则 返回 
NULL ° 

int putc(int c, FILE *stream) 


putc 函数 等 价 于 fputc， 所 不 同 的 是 ， 当 pute 函数 定义 为 安 时 ， 它 可 能 
多 次 计算 


stream 的 值 。 
int putchar(int c) 
putchar(c) KAU fF putc(c, stdout) ° int puts(const char *s) 


puts 函数 把 字符 串 s 和 一 个 换行 符 输 出 到 stdout 中 。 如 果 发 生 错 误 ， 
则 返回 EOF; 否 则 返回 一 个 非 负 值 。 


int ungetc(int c, FILE *stream) 

ungetc 函数 把 c( 转 换 为 unsigned char 类 型 ) 写 回 到 流 stream F, PAX 
该 流 进行 读 操作 时 ， 将 返回 该 字符 对 每 个 流 只 能 写 回 一 个 字符 ， 且 
此 字符 不 能 是 EOF。ungetc 函数 返回 被 写 回 的 字符 ， 如 果 发 生 错误 ， 
则 返回 EOF 。 

B.1.5 直接 输入 /输出 函数 


size_t fread(void *ptr, size_t size, size_t nobj, FILE *stream) fread 函数 从 
流 stream 中 读 取 最 多 nobj 个 长 度 为 size 的 对 象 ， 并 保存 到 ptr 指 问 


的 数组 中 。 它 返回 读 取 的 对 象 数目 ， 此 返回 值 可 能 小 于 nobj。 必 须 通 
过 函数 feof 和 ferror 


获得 结果 执行 状态 。 


size_t fwrite(const void *ptr, size_t size, size_t nobj, FILE *stream) fwrite 
函数 从 ptr 48 AIRE PIEN nobj 个 长 度 为 size 的 对 象 ， 并 输出 到 流 


stream 


i o 它 返 回 输出 的 对 象 数 目 。 如 宁 发 生 错误 ， 返 回 值 会 小 于 nobj 的 
B.1.6 文件 定位 函数 

int fseek(FILE *stream, long offset, int origin) 

fseek 函数 设置 流 stream 的 文件 位 置 ， 后 续 的 读 写 操作 将 从 新 位 置 开 
始 。 对 于 二 进 制 文件 ， 此 位 置 被 设置 为 从 origin 开始 的 第 offset 个 字 
符 处 。Origin 的 值 可 以 为 SEEK_SET (文件 开始 处 )、SEEK_CUR( 当 前 
位 置 ) 或 SEEK_END( 文 件 结束 处 )。 对 于 文本 流 ，offset 必须 设置 为 

0， 或 者 是 由 函数 ftell 返回 的 值 (此 时 origin 的 值 必须 是 SEEK_SET) ° 
fseek 函数 在 出 错时 返回 一 个 非 0 值 。 


long ftell(FILE *stream) 


ftell BOX] stream MN SBC AL, HPA AO EIL 。 
void rewind(FILE *stream) 


rewind(fp) 函 数 等 价 于 语句 fseek(fp, OL, SEEK_SET)iclearerr(fp) 的 执行 
Zt FA o 


2H 
int fgetpos(FILE *stream, fpos_t *ptr) 


fgetpos 函数 把 stream 流 的 当前 位 置 记 录 在 *ptr 中 ， 供 随后 的 fsetpos 
函数 调用 使 用。 者 出 错 则 返回 一 个 非 0 值 。 


int fsetpos(FILE *stream, const fpos_t *ptr) 


fsetpos 函数 将 流 stream 的 当前 位 置 设置 为 fgetpos 记录 在 *ptr 中 的 位 
置 。 大 出 错 则 返回 一 个 非 0 值 。 


B.1.7 错误 处 理 函 数 


当 发 生 错 误 或 到 达 文 件 末 尾 时 ， 标 准 库 中 的 许多 函数 都 会 设置 状态 指 
示 符 。 这 些 状态 指 示 符 可 被 显 式 地 设置 和 测试 。 另 外 ， 整 型 表达 式 
errno( 在 <errno.h> 中 声明 ) 可 以 包含 一 个 错误 编号 ， 据 此 可 以 进一步 了 
解 最 近 一 次 出 错 的 信息 。 


void clearerr(FILE *stream) 
clearerr 函数 清除 与 流 stream 相关 的 文件 结束 符 和 错误 指示 符 。 
int feof(FILE *stream) 


To stream 流 相关 的 文件 结束 指示 符 ，feof 函数 将 返回 一 个 
O18, 


int ferror(FILE *stream) 


eA stream 流 相关 的 错误 指示 符 ，ferror 函数 将 返回 一 个 非 0 
f [0] 


void perror(const char *s) 


perror(s) 范 数 打印 字符 串 s 以 及 与 ermo 中 整 型 值 相 应 的 错误 信息 ， 错 
误 信 息 的 具 体内 容 与 具体 的 实现 有 关 。 该 函数 的 功能 类 似 于 执行 下 列 


BA: 


fprintf(stderr, "%s: %s\n", s, "error message"); 


ARKI strerror 的 信息 ， 参 见 B.3 市 中 的 介绍 。 


B.2 字符 类 别 测试 :<ctype.h> 


头 文 件 <ctype.h> 中 声明 了 一 些 测试 字符 的 钞 数 。 每 个 函数 的 参数 均 为 
int RAY, BR 的 值 必须 是 EOF 或 可 用 unsigned char 类 型 表示 的 字 

人 特 ， 画 数 的 返回 值 为 int RÆ °- UWR 参数 c 满足 指定 的 条 件 ， 则 函数 
返回 非 0 值 (表示 真 )， 否 则 返回 0( 表 示 假 )。 这 些 函 数 包括 : 


isalnum(c) 函数 isalpha(c)#X isdigit(c) NA 


isalpha(c) 函数 isupper(c) 或 islower(c)N & iscntrl(c) cH 
控制 字符 


isdigit(c) c 为 十 进 制 数字 isgraph(c) c 是 除 空 格外 的 可 打 
印字 符 islower(c) c 是 小 写字 母 isprint(a) c 是 包括 空格 
的 可 打印 字符 

ispunct(c) c 是 除 空 格 、 字 母 和 数字 外 的 可 打印 字符 


isspace(c) CEASE > PROUT > HITIT > BER ` BAIRD Ze TT BX 
Bh le) rel) Fe FF 


isupper(c) c 是 大 写字 母 
isxdigit(c) c 是 十 六 进 制 数字 


在 7 位 ASCII 字符 集中 ， 可 打印 字符 是 从 0x20( ) 到 0x7E(~') 之 间 的 
字符 ;控制 字符 是 从 0(NUL) 到 0xlF(US) 之 间 的 字符 以 及 字符 
0x7F(DEL) ° 


另外 ， 下 面 两 个 函数 可 用 于 字母 的 大 小 写 转换 : int tolower(int 
C) sg 将 c 转换 为 小 写字 母 int toupper(int c) 将 c 转换 为 大 写 
子 


WR c 是 大 写字 母 ， 则 tolower(@ 返 回 相 应 的 小 写字 母 ， 否 则 返回 c。 
WR c 是 小 写字 母 ， 则 toupper(@ 返 回 相应 的 大 写字 母 ， 否 则 返回 c。 


B.3 =F EKA: <string.h> 


Sk CFR <string.h> FE T BAZAAR FFB EK Bo BAKRA FL str 
开头 ;第 二 组 函数 的 名 字 以 mem 开头 。 除 函数 memmove 9h, HERK 
数 都 没有 定义 重 有 到 对 象 间 的 复制 行为 。 比较 函数 将 把 参数 作为 
unsigned char 类 型 的 数组 看 得 。 


在 下 表 中 ， 变 量 s 和 t 的 类 型 为 char *;cs 和 ct 的 类 型 为 const char *;n 
的 类 型 为 size_t;c 的 类 型 为 int( 将 被 转换 为 char 类 型 )。 


char *strcpy(s,ct) 


将 字符 串 ct 中 最 多 前 n 个 字符 连接 到 字符 串 s 的 


比较 字符 串 cs 和 ct; 当 cs<ct AY, — SN HEL 
4 cs==ct 时 ， 返 回 0; 当 cs>ct 时 ， 返 回 一 个 正 


int strcmp(cs,ct) 


int stmcmp(cs,ct,n) FFE cs 中 至 多 前 n 个 字符 与 字符 串 ct 相 比 


当 cs<ct 时 ， 返 回 一 个 负数 : 当 cs==ct 时 ， 返 回 
0; 当 cs>ct 时 ， 返 回 一 个 正 数 


char *strchr(cs,c) 返回 指 问 字符 c 在 字符 串 cs 中 第 一 次 出 现 的 位 置 
的 


Str Ue cs 中 不 包含 c， 则 该 函数 返回 NULL 


char *strrchr(cs,c) 


char *strstr(cs,ct) 


size_t strspn(cs,ct) | 


size_t strlen(cs) 


Po ht 


FIT Cc 


[Fl FEF ATER cs 中 最 后 一 次 出 现 的 位 


返回 指 
cl 


的 指针 ;如 果 cs 中 不 包 合 ce， 则 该 函数 返回 NULL 


FR cs 中 包含 ct 中 的 字符 的 前 缀 的 长 度 


i 
E 
A 
A 


串 cs PAER ct PAA ATE RIJKE 


返回 一 个 指针 ， 它 指向 字符 串 ct 中 的 任意 字符 第 


次 出 现在 字符 串 cs 中 的 位 置 ;如 果 cs 中 没有 与 ct 


相同 的 字符 ， 则 返回 NULL 


返回 一 个 指针 ， 它 指向 字符 串 ct 第 一 次 出 现在 字 
符 


E cs 中 的 位 置 ;如 果 cs 中 不 包含 字符 串 ct， 则 返 


回 NULL 


返回 字符 串 cs 的 长 度 


char *strerror(n) 


退回 一 个 指针 ， 它 指 回 与 错误 编号 n 对 应 的 错误 信 


字符 串 (错误 信息 的 具体 内 容 与 具体 实现 相关 ) 


char *strtok(s,ct) “strtok 函数 在 s 中 搜索 由 ct 中 的 字符 界定 的 记号 。 
详细 信息 参见 下 面 的 讨论 


对 strtok(s, cb 进行 一 系列 调用 ， 可 以 把 字符 串 s 分 成 许多 记号 ， 这 些 
记号 以 ct 中 的 字符 为 分 界 符 。 第 一 次 调用 时 ，s 为 非 空 。 它 搜索 s， 
找到 不 包含 ct 中 字符 的 第 一 个 记号 ， 将 s 中 的 下 一 个 字符 替换 为 \0'， 
并 返回 指 辣 记号 的 指针 。 随 后 ， 每 次 调用 strtok 函数 时 (由 s 的 值 是 否 
为 NULL 指示 )， 均 返回 下 一 个 不 包含 ct 中 字符 的 记号 。 当 s 中 没有 
这 样 的 记号 时 ， 返 回 NULL。 每 次 调用 时 字符 串 ct 可 以 不 同 。 


以 mem FAAI KRZR FIFRE ANERER R, HER HIE hek 


一 个 高 效 的 函数 接 口 。 在 下 表 列 出 的 函数 中 ，s A t 的 类 型 均 为 void 
*，cs 和 ct 的 类 型 均 为 const void*, n 的 类 型 为 size t, c 的 类 型 为 
int( 将 被 转换 为 unsigned char 类 型 )。 


将 字符 串 ct 中 的 n 个 字符 拷贝 到 s 中 ， 并 返回 s 


该 函数 的 功能 与 memcpy 相似 ， 所 不 同 的 是 ， 当 
HREF 


时 ， 该 函数 仍 能 正确 执行 


将 cs 的 前 n 个 字符 与 ct 进行 比较 ， 其 返回 值 与 
strcmp 


的 返回 值 相同 


void 返回 一 个 指针 ， 它 指 问 c 在 cs 中 第 一 次 出 现 的 位 
*memchr(cs,c,n) |E ° WR 


cs 的 前 nm 个 字符 中 找 不 到 匹配 ， 则 返回 NULL 


将 s 中 的 前 n CERRAH c, HRE s 


B.4 AEKA: <math.h> 


MF <math.h> F EH T PERLE BAZ o 


Æ EDOM 和 ERANGE( 在 头 文件 <errorh> 中 声明 ) 是 两 个 非 0 整 型 常 
量 ， 用 于 指示 函数 的 定义 域 错 误 和 值 域 错 误 ;HUGE_VAL 是 一 个 
double 类 型 的 正 数 。 当 参数 位 于 函数 定义 的 作用 域 之 外 时 ， 就 会 出 现 
定义 域 错误 。 在 发 生 定义 域 错误 时 ， 全 局 变量 erno 的 值 将 被 设 置 为 
EDOM， 函 数 的 返回 值 与 具体 的 实现 相关 。 如 果 函 数 的 结果 不 能 
double 类 型 表示 ， 则 会 发 生 值 域 错误 。 当 结果 上 淤 时 ， 函 数 返 回 
HUGE_VAL， 并 带 有 正确 的 正 负 号 ，errpo 的 值 将 被 设置 为 

ERANGE ° 44 Pimiy, KORE 0, T erno 是 否 设置 为 
ERANGE 要 视 具 体 


的 实现 而 定 。 


在 下 表 中 , x 和 y 的 类 型 为 double，n 的 类 型 为 nt， 所 有 函数 的 返回 
值 的 类 型 均 为 double。 三 角 函 数 的 角度 用 弧度 表示 。 


wane) fan 值 域 为 [ rw 2, TV 2] 


say fen “1(y/x)， 值 域 为 [sn n] 


tanh(x) x 的 双 曲 正切 值 


| 

oat) mt nts), HEF DO 

pao om p 10 为 底 的 对 数 log , (x)， 其 中 x>0 
将 产生 定义 


pow(x,y) 
域 错误 IR 


cll 的 平方 根 ， 其 中 xi 
UN x BEES, SEA x R double 


° 如 有 果 x=0 H y 运 0， 或 者 x<0 Hy 不 是 整 型 数 ， 


Booo EAF KOBER, SE HE oe 
ao | 的 绝对 值 
ese) pra x.2" 的 值 


frexp(x, int *ip) 把 x 分 成 一 个 在 [12， 1] 区 间 内 的 真 分 数 和 一 个 2 的 军 


果 将 返回 真 分 数 部 分 ， 并 将 军 数 保存 在 *exp 中 。 如 
果 x 为 0， 


则 这 两 部 分 均 为 0 
modf(x, double | 把 J 分 成 整数 和 小 数 两 部 分 ， 两 部 分 的 正 负 号 均 与 x 
数 返 回 小 数 部 分 ， 整 数 部 分 保存 在 ‘ip 中 
求 Jy 的 浮 点 余数 ， 符 号 与 相同。 如 果 y 为 0， 则 


结果 与 具体 
的 实现 相关 


B.5 XH RA: <stdlib.h> 


头 文件 <stdlib.h> 中 声明 了 一 些 执行 数值 转换 、 内 存 分 配 以 及 其 它 类 似 
工作 的 函数 。 


double atof(const char *s) 


atof 函数 将 字符 E s 转 换 为 double 类 型 。 该 函数 等 价 于 strtod (s, 
(char**)NULL) ° 


int atoi(const char *s) 


atoi 函数 将 字符 串 s 转换 为 int RAY o ZALES HY 于 (int)strtol(s, 
(char**)NULL, 10) 。 


long atol(const char *s) 


atol 函数 将 字符 串 s 转换 为 long 类 型 。 该 函数 等 价 于 strtol(s, 
(char**)NULL, 10) ° 


double strtod(const char *s, char **endp) 


strtod 函数 将 字符 串 s 的 前 级 转换 为 double 类 型 ， 并 在 转换 时 跳 过 s 的 
AUS 2 Ato BRT endp 为 NULL， 否 则 该 函数 将 把 指向 s 中 未 转换 部 
分 (s 的 后 级 部 分 ) 的 指针 保存 在 *endp 中 。 如 果 结 果 上 洪 ， 则 函数 返回 
带 有 适当 符号 HUGE_VAL; 如 果 结 果 下 洲 ， 则 返回 0。 在 这 两 种 情况 
F, erno 都 将 被 设置 为 ERANGE。 


long strtol(const char *s, char **endp, int base) 


strtol 函数 将 字符 串 s 的 前 级 转换 为 long 类 型 ， 并 在 转换 时 跳 过 s 的 前 
导 空 白 符 。 除 非 endp 为 NULL， 否 则 该 函数 将 把 指向 s 中 末 转 换 部 分 
(s 的 后 辍 部 分 ) 的 指针 保存 在 *endp 中 。 如 果 base 的 取 值 在 236 之 
间 ， 则 假定 输入 是 以 该 数 为 基底 的 ;如 果 base 的 取 值 为 0， 则 基 放 为 
八进制 、 十 进 制 或 十 六 进 制 。 以 0 为 前 级 的 是 八进制 ， 以 Ox 或 0X 为 
前 级 的 是 十 六 进 制 。 无 论 在 哪 种 情况 下 。 字 母 均 表示 10 依 base*1 之 间 
的 数字 。 如 果 base 值 是 16， 则 可 以 加 上 前 导 Ox 或 0X。 如 果 结 果 上 
液 ， 则 函数 根据 结果 的 符号 返回 LONG_MAX 或 LONG_MIN， 同时 
将 ermo 的 值 设置 为 ERANGE。 


unsigned long strtoul(const char *s, char **endp, int base) 


strtoul 函数 的 功能 与 strtol 函数 相同 ， 但 其 结果 为 unsigned long 类 型 ， 
错误 值 为 ULONG_MAX ° 


int rand(void) 


rand 函数 产生 一 个 0@RAND_ MAX 之 间 的 伪 随 机 整数 。RAND_MAX 
的 取 值 至 少 为 32767。 


void srand(unsigned int seed) 


srand 函数 将 seed 作为 生成 新 的 伪 随 机 数 序列 的 种 于 数 。 种 于 数 seed 
的 初 值 为 1。 


void *calloc(size_t nobj, size_t size) 


calloc 函数 为 由 nobj 个 长 度 为 size 的 对 象 组 成 的 数组 分 配 内 存 ， 并 返 
回 指向 分 配 区 域 的 指针 ;者 无 法 满足 要 求 ， 则 返回 NULL。 该 空间 的 初 
BEA 0 =F ° 


void *malloc(size_t size) 


malloc 函数 为 长 度 为 size 的 对 象 分 配 内 存 ， 并 返回 指 癌 分 配 区 域 的 指 
ee 要 求 ， 则 返回 NULL 。 该 函数 不 对 分 配 的 内 存 区 域 进 行 
AYN ° 


void *realloc(void *p, size_t size) 


realloc 函数 将 p 指 问 的 对 象 的 长 度 修改 为 size SF o WRT BC 
内 存 比 原 内 存 大 ， 则 原 内 存 的 内 容 保 持 不 变 ， 增 加 的 空间 不 进行 初始 
化 。 如 果 新 分 配 的 内 存 比 原 内 存 小 ， 则 新 分 配 内 存单 元 不 被 初始 

化 :realloc 函数 返回 指 疝 新 分 配 空 间 的 指针 ; 若 无 法 满足 要 求 ， 则 返回 
NULL 。 在 这 种 情况 下 ， 原 指针 p 指 回 的 单元 内 容 保持 不 变 。 


void free(void *p) 


free 函数 释放 p JAMAN FESS IA] o 4 p 的 值 为 NULL 时 ， 该 函数 不 执 
行 任何 操作 。P 必须 指 问 先前 使 用 动态 分 配 了 五 数 malloe、realloc 或 
calloc 分 配 的 空间 。 


void abort(void) 


abort 函数 使 程序 非 正 常 终止 。 其 功能 与 raise(SIGABRT) 类 似 。 void 
exit(int status) 


exit 范 数 使 程序 正常 终止 。atexit 函数 的 调用 顺序 与 登记 的 顺序 相反 ， 
这 种 情况 下 ， 所 有 已 打开 的 文件 缓冲 区 将 被 清洗 ， 所 有 已 打开 的 流 将 
被 关闭 ， 控 制 也 将 返回 给 环境 。status 


的 值 如 何 返 回 给 环境 要 视 具 体 的 实现 而 定 ， 但 0 值 表示 终止 成 功 。 也 
可 使 用 值 EXIT_SUCCESS 


和 EXIT_FAILURE 作为 返回 值 。 
int atexit(void (*fcn)(void)) 


atexit 函数 登记 函数 fcn， 该 函数 将 在 程序 正常 终止 时 被 调用 。 如 果 登 
记 失 败 ， 则 返回 非 0 值 。 


int system(const char *s) 


system ERC AT AB s 传递 给 执行 环境 。 如 采 s 的 值 为 NULL， 并 且 
有 命令 处 理 程序 ， 则 该 函数 返回 非 0 值 。 如 果 s 的 值 不 是 NULL， 则 
返回 值 与 具体 的 实现 有 关 。 


char *getenv(const char *name) 


getenv 函数 返回 与 name 有 关 的 环境 字符 串 。 如 果 该 字符 串 不 存在 ， 
则 返回 NULL ° H 细 市 与 具体 的 实现 有 关 。 


void *bsearch(const void *key, const void *base, size_t n, size_t size, 


int (*cmp)(const void *keyval, const void *datum)) 


bsearch 函数 在 base[0]...base[n*1] 之 间 查 找 与 *key 匹配 的 页 。 在 函数 
cmp 中 ， 如 果 第 一 个 参数 (查找 关键 字 ) 小 于 第 二 个 参数 ( 表 页 )， 它 必 
须 返 回 一 个 负 值 ; 如 采 第 一 个 参数 等 于 第 二 个 参数 ， 它 必须 返回 零 ; 如 
果 第 一 个 参数 大 于 第 二 个 参数 ， 它 必须 返回 一 个 正 值 。 数 组 base 中 的 


页 必须 按 升序 排列 。bsearch 函数 返回 一 个 指针 ， 它 指 同 一 个 匹配 页 ， 
如 果 不 存 在 匹配 页 ， 则 返回 NULL ° 


void qsort(void *base, size_t n, size_t size, int (*cmp)(const void *, const 
void *)) 


qsort 函数 对 base[0]...base[ne1] 数 组 中 的 对 象 进行 升 序 排 序 ， 数 组 中 每 
个 对 象 的 KER size ° PEPEK cmp 与 bsearch 函数 中 的 描述 相同 。 


int abs(int n) 

abs 函数 返回 int 类 型 参数 n 的 绝对 值 。 
long labs(long n) 

labs 函数 返回 long 类 型 参数 n 的 绝对 值 。 
div_t div(int num, int denom) 


div 函数 计算 num/denom 的 商 和 余数 ， 并 把 结果 分 别 保存 在 结构 类 型 
div_t 的 两 个 int 


类 型 的 成 员 quot 和 rem 中 。 
Idiv_t Idivdong num, long denom) 


idiv 函数 计算 num/denom 的 商 和 余数 ， 并 把 结果 分 别 保 存在 结构 类 型 
idiv t 的 两 个 


long 类 型 的 成 员 quot 和 rem 中 。 

B.6 诊断 :<assert.h> 

assert 宏 用 于 为 程序 增加 诊断 功能 。 其 形式 如 下 : 

void assert(int expression) 

如 果 执 行 语句 

assert(expression) 

时 ， 表 达 式 的 值 为 0， 则 assert 宏 将 在 stderr 中 打印 一 条 消息 ， 比 如 : 
Assertion failed: #235, file 源 文 件 名 , line 行 号 


打印 消 恩 后 ， 该 宏 将 调用 abort 终止 程序 的 执行 。 其 中 的 源 文 件 名 和 
{TSK AF Ub ae 


FILE 及 LINE ° 


如 采 定 义 了 安 NDEBUG， 同 时 又 包含 了 头 文件 <asserLh>， 则 assert Z 
将 被 忽略 。 


B.7 可 变 参 数 表 :<stdarg.h> 
头 文件 <stdarg.h> 提 供 了 遍历 未 知 数目 和 类 型 的 钞 数 参数 表 的 功能 。 
假定 函数 f 帝 有 可 变数 目的 实际 参数 ，lastarg 是 它 的 最 后 一 个 命名 的 


WAS ° AA, FERS ARR TRAA va_list HRE ap, EN 
依次 指 同 每 个 实际 参数 : 


va_list ap; 
在 访问 任何 未 命名 的 参数 前 ， 必 须 用 va 一 start 宏 初 始 化 ap 一 次 : 


va_start(va_list ap, lastarg); 


此 后 ， 每 次 执行 宏 va arg 都 将 产生 一 个 与 下 一 个 未 命名 的 参数 具有 相 
同类 型 和 数值 的 值 ， 它 同时 还 修改 pp， 以 使 得 下 一 次 执行 va_arg 时 
返回 下 一 个 参数 : 

type va_arg(va_list ap, type); 


在 所 有 的 参数 处 理 完毕 之 后 ， 且 在 退出 函数 { 之 前 ， 必 须 调 用 安 
va_end 一 次 ， 如 下 所 示 : 


void va_end(va_list ap); 


B.8 非 局 部 跳 转 :<setjmp.h> 
头 文件 <setjmp.h> 中 的 声明 提供 了 一 种 不 同 于 通常 的 贸 数 调用 和 返回 
La 式 ， 特 别 是 ， 它 允许 立即 从 一 个 深层 肉 套 的 函数 调用 中 返 


int setjmp(jmp_buf env) 


setjmp 宏 将 状态 信息 保存 到 env 中 ， 供 longjmp (EH ° RA RA 


setjmp, MINE 


回 值 为 0; 如 果 是 在 longjmp 中 调用 setjmp， 则 返回 值 为 非 ° Setjmp 
只 能 用 于 某 些 上 下 OCH, AF if iB) + switch 语句 、 循 环 语句 的 条 
件 测 试 中 以 及 一 些 简单 的 关系 表达 式 中 。 例如 : 


if (setjmp(env) == 0) 
/* get here on direct call */ else 
/* get here by calling longjmp */ void longjmp(jmp_buf env, int val) 


longjmp 通过 最 近 一 次 调用 setimp 时 保存 到 env 中 的 信息 恢复 状态 ， 
同时 ， 程 序 重新 恢复 执行 ， 其 状态 等 同 于 setjmp 宏 调 用 刚刚 执行 完 并 
返回 非 0 值 val。 包 含 setjmp 宏 调 用 的 函数 的 执行 必须 还 没有 终止 。 
除 下 列 情况 外 ， 可 访问 对 象 的 值 同 调用 longjmp 时 的 值 相 同 :在 调用 
setjmp 宏 后 ， 如 果 调 用 setimp 安 的 函数 中 的 非 volatile 目 动 变量 改变 
了 ， 则 它们 将 变 成 未 定义 状态 。 


B.9 信号 :<signal.h> 


头 文 件 <signal.h> 提 供 了 一 些 处 理 程序 运行 期 间 引 发 的 各 种 异常 条 件 的 
功能 ， 比 如 来 源 于 外 部 的 中 断 信 和 号 或 程序 执行 错误 引起 的 中 断 信 号 。 


void (*signal(int sig, void (*handler)(int)))(int) 

sional 决定 了 如 何 处 理 后 续 的 信号 。 如 果 handler 的 值 是 SIG_DFL， 则 
采用 由 实现 定义 的 默认 行为 ;如 果 handler 的 值 是 SIG_IGN， 则 忽略 该 
信号 ;人 否则， 调用 handler 指 回 的 函数 (以 信号 作为 参数 )。 有 效 的 信号 
包括 : 

SIGABRT 异常 终止 ， 例 如 由 abort 引起 的 终止 

SIGFPE 算术 运算 出 错 ， 如 除数 为 0 Blatt SIGILL 非法 
函数 映像 ， 如 非法 指令 

SIGINT 用 于 交互 式 目的 信号 ， 如 中 断 


SIGSEGV 非法 存储 器 访问 ， 如 访问 不 存在 的 内 存单 元 


SIGTERM 发 送 给 程序 的 终止 请 求 

对 于 特定 的 信号 ，signal 将 返回 handler 的 前 一 个 值 ;如 果 出 现 错误 ， 则 
返回 值 SIG_ERR。 当 随 后 碰 到 信号 sig 时 ， 该 信号 将 恢复 为 默认 行 
为 ， 随 后 调用 信号 处 理 程序 ， 就 好 像 由 


(*handler)(sig) 调 用 的 一 样 。 信 号 处 理 程序 返回 后 ， 程 序 将 从 信号 发 生 
的 位 置 重新 开始 


PUT? 
言 号 的 初始 状态 由 具体 的 实现 定义 。 


int raise(int sig) 

raise 向 程序 发 送信 号 sig。 如 果 发 送 不 成 功 ， 则 返回 一 个 非 0 值 。 
B.10 日 期 与 时 间 函 数 :<time.h> 

头 文件 <timeh> 中 声明 了 一些 处 理 日 期 与 时 间 的 类 型 和 画 数 。 其 中 的 


一 些 函 数 用 于 处 理 当地 时 间 ， 因 为 时 区 等 原 同 ， 当 地 时 间 与 日 历时 间 
可 能 不 相同 。clock_t 和 time t 是 两 个 


表示 时 间 的 算术 类 型 ，struct tm 用 于 保存 日 历时 间 的 各 个 构成 部 分 。 
结构 tm 中 各 成 员 的 用 途 及 取 值 范围 如 下 所 示 : 


tm_sec; “从 当前 分 钟 开始 经 过 的 秒 数 (0, 61) 
tm_min; | 从 当前 小 时 开始 经 过 的 分 钟 数 (0, 59) 


oo 从 午夜 开始 经 过 的 小 时 数 (0, 23) 
nmas: HRB an 

immo; A RE, 1 
on yer; | 000 See 


tm_wday; | 从 星期 天 起 经 过 的 天 数 (0, 6) 
tm_yday; | 从 1 月 1 日 起 经 过 的 天 数 (0, 365) 


tm_isdst; | 夏令 时 标记 


用 令 时 ，tm_isdst 的 值 为 正 ， 否 则 为 0。 如果 该 信息 无 效 ， 则 其 值 为 


(0) 


总 淋 


clock_t clock(void) 


clock E 函数 返回 程序 开始 执行 后 占用 的 处 理 器 时 间 。 如 果 无 法 获取 处 理 
器 时 间 ， 则 返回 值 为 .1 。dlock()/CLOCKS_PER_SEC 是 以 秒 为 单位 表 
示 的 时 间 。 


time t time(time_t *tp) 


time 函数 返回 当前 日 历时 间 。 如 采 无 法 获取 日 历时 间 ， 则 返回 值 为 
1° 如果 了 tp 不 是 NULL， 则 同时 将 返回 值 赋 给 *tp 。 


double difftime(time_t time2, time_t time1) difftime KZOE] time2*time1 


的 值 (以 秒 为 单位 ) 。 
time_t mktime(struct tm *tp) 


mktime 函数 将 结构 *tp 中 的 当地 时 间 转 换 为 与 time 表示 方式 相同 的 日 
历时 间 ， 结 构 中 各 成 员 的 值 位 于 上 面 所 示范 围 之 内 。mktime 函数 返 
回转 换 后 得 到 的 日 历时 间 ; 如 果 该 时 间 不 能 表示 ， 则 返回 "1。 


下 面 4 个 画 数 返回 指向 可 被 其 它 调用 禾 盖 的 静态 对 象 的 指针 。 
char *asctime(const struct tm *tp) 

asctime 函数 将 结构 *tp 中 的 时 间 转 换 为 下 列 所 示 的 字符 串 形式 : 
Sun Jan 3 15:14:13 1988\n\0 char *ctime(const time_t *tp) 


ctime 函数 将 结构 *tp FAY AY a RN SS HO TB] o ESE HTT RFE 
数 调用 : 


asctime(localtime(tp)) 


struct tm *gmtime(const time_t *tp) 


gmtime 函数 将 *tp 中 的 日 历时 间 转 换 为 协调 世界 时 (UTC)。 如 果 无 法 获 
取 UTC， 则 该 KORE NULL ° HAZ F gmtime 有 一 定 的 历史 意 
X. o 


struct tm *localtime(const time_t *tp) localtime HACK 25k) *tp 中 的 日 历 


时 间 转 换 为 当地 时 间 。 


size_t strftime(char *s, size_t smax, const char *fmt, const struct tm 
*tp) 


strftime 函数 根据 fmt 中 的 格式 把 结构 *tp 中 的 日 期 与 时 间 信 息 转 换 为 
指定 的 格式 ， 并 存储 到 s 中 ， 其 中 fmt 类 似 于 printf 函数 中 的 格式 说 
明 。 普 通 字符 (包括 终结 符 \0) 将 复制 到 s 中 。 每 个 %c 将 按照 下 面 摘 壕 
的 格式 奉 换 为 与 本 地 环境 相 适 应 的 值 。 最 多 smax 个 字符 写 到 s 中 。 
strftime 函数 返回 实际 写 到 s 中 的 字符 数 (不 包括 字符 \0); 如 果 字 符 数 
多 于 smax， 该 函数 将 返回 值 ° 


fmt 的 转换 说 明 及 其 含义 如 下 所 示 : 


%a 一 星期 中 各 天 的 缩写 名 
%A 一 星期 中 各 天 的 全 名 
%b 缩写 的 月 份 名 

%B 月 份 全 名 

%C 当地 时 间 和 日 期 表示 

%d 一 个 月 中 的 某 一 天 (01*31) 
%H 小 时 (24 小 时 表示 )(00*23) 
%I 小 时 (12 小 时 表示 )(01*12) 
%j 一 年 中 的 各 天 (001 一 366) 
%m 月 份 (01.12) 

%M 分 钟 (00*59) 


%p 与 AM 5 PM 相应 的 当地 时 间 等 价 表示 方法 


%S (00°61) 


%U 一 年 中 的 星期 序号 (0053， 将 星期 日 看 作 是 每 周 的 第 一 天 ) 


%w 一 周 中 的 各 天 (0.6， 星 期 日 为 0) 
%W 一 年 中 的 星期 序号 (0053， 将 星期 一 看 作 是 每 周 的 第 一 天 ) 


96X 当地 日 期 表示 

%X 当地 时 间 表 示 

%y 不 带 世 纪 数 目的 年 份 (00*99) 
%Y 带 世 纪 数 目的 年 份 

%Z, 时 区 名 (如 果 有 的 话 ) 

%% YA 


B.11 与 具体 实现 相关 的 限制 :<limits.h> 和 


<float.h> 


头 文件 <limits.h> 定 义 了 一 些 表 示 整 型 大 小 的 遂 量 。 以 下 所 列 的 值 是 可 
接受 的 最 小 值 ， 在 实际 系统 中 可 以 使 用 更 大 的 值 。 


8 char 类 型 的 位 数 
CHAR MAX UCHAR MAX 或 SCHAR_MAX char 类 型 的 最 大 值 
0 或 SCHAR_MIN char 类 型 的 最 小 值 
32767 int 类 型 的 最 大 值 


INT MIN _ |*32767 int 类 型 的 最 小 值 
LONG MAX 2147483647 long 类 型 的 最 大 值 
LONG _ MIN |.2147483647 long 类 型 的 最 小 值 


HHH 


short 类 型 的 最 大 值 
short 类 型 的 最 小 值 


下 表 列 出 的 名 字 古 <float.h> 的 一 个 子 集 ， 它 们 是 与 浮 点 算术 运算 相关 
的 一 些 常 量 。 给 出 的 每 个 值 代表 相应 量 的 最 小 取 值 。 各 个 实现 可 以 定 
义 适当 的 值 。 


FLT_RADIX FLT_ROUNDS ”|2 | 指数 表示 的 基数 ， 例 如 2、16 
FLT DIG FLT_EPSILON 加 法 的 浮 点 舍 入 模式 表示 精 
FLT MANT DIG 6 度 的 十 进 制 数字 


FLT_MAX FLT_MAX_EXP 1E+37 


DBL_EPSILON 


DBL_MANT_DIG 


DBL_MAX DBL_MAX_EXP 


1E+37 


DBL_MIN DBL_MIN_EXP 1E*37 


最 小 的 数 x，x 满足 :1.0 + x 
1.0 


尾数 中 的 数 ( 以 FLT_RADIX 
为 基数 ) 


最 大 的 译 点 数 


最 大 的 数 n，n 满足 
FLT_RADIX "1 仍 是 可 表示 的 


最 小 的 规格 化 浮 点 数 


最 小 的 数 n，n 满足 :10 "是 一 
个 规格 化 数 


最 小 的 数 x，x 满足 :1.0 +x 
1.0 


尾数 中 的 数 ( 以 FLT_RADIX 
为 基数 ) 
最 大 的 双 精 度 浮 点 数 


最 大 的 数 n，n 满足 
FLT_RADIX "91 仍 是 可 表示 的 


最 小 的 规格 化 双 精 度 译 点数 


最 小 的 数 n，n 满足 :10 "是 一 
个 规格 化 数 


附录 C 变更 小 结 


目 本 书 第 1 版 出 版 以 来 ，C 语言 的 定义 已 经 发 生 了 一 些 变化 。 几 平 每 
次 变化 都 是 对 原 语 言 的 一 次 扩充 ， 同 时 每 次 扩充 都 是 经 过 精心 设计 
的 ， 并 保持 了 与 现 有 版 本 的 兼容 性 ;其 中 的 一 些 修改 修正 了 原版 本 中 的 
歧义 性 摘 述 ; 某 些 修改 是 对 已 有 版 本 的 变更 。 许 多 新 增 功 能 都 是 随 
AT&T 提供 的 编译 卓 的 文档 一 同 发 布 的 ， 并 个 此 后 的 其 它 C Saar He 
应 商 采 纳 。 前 不 久 ，ANSI 标准 化 协会 在 对 C 语言 进行 标准 化 时 采纳 
了 其 中 绝 大 部 分 的 修改 ， 并 进行 了 其 它 一 些 重要 修 正 。 甚 至 在 正式 的 
C o ZH, ANSI WIAD 2 E Ea EnB RH 
米 o 


本 附录 总 结 了 本 书 第 1 版 定义 的 C 语言 与 ANSI 新 标准 之 间 的 差别 。 
我 们 在 这 里 仅 讨 论 语言 本 身 ， 不 涉及 环境 和 库 。 尽 管 环境 和 库 也 是 标 
准 的 重要 组 成 部 分 ， 但 它们 与 第 1 版 几乎 


无 可 比 之 处 ， 因 为 第 1 版 并 没有 试图 规定 一 个 环境 或 库 。 


与 第 1 版 相 比 ， 标 准 C 中 关于 预 处 理 的 定义 更 加 细致 ， 并 进 
行 了 扩充 :明确 以 记号 为 基础 ;增加 了 连接 记号 的 运算 符 ( 规 ) 和 生成 字符 
串 的 运算 符 ( 坎 ;增加 了 新 的 控制 指令 (如 #elif 和 #pragma); 明 确 人 允许 使 用 
相同 记号 序列 重新 声明 宏 ; 字 符 串 中 的 形式 参数 不 再 被 奉 换 。 人 允许 在 任 
何 地 方 使 用 反 和 斜 杠 字 “\" 进 行 行 的 连接 ， 而 不 仅仅 限于 在 字符 串 和 安 
定义 中 。 详 细 信 息 参 见 A.12 条。 

所 有 内 部 标识 符 的 最 小 有 效 长 度 增 加 为 31 个 字符 ;具有 外 部 连 
o a 效 长 度 仍 然 为 6 个 字符 (很 多 实现 中 允许 更 长 的 
MIRIT) ° 


通过 双 问 写 ” ??" 引 入 的 三 字符 序列 可 以 表示 某 些 字符 集 
中 缺少 的 字符 。 定 义 了 #、 


Eo] sfc} 0 |. GRRE, SIL AI2I Te Hm, SSR 


: 引入 了 一 些 新 关键 字 (void ` const ` volatile ` signed 和 enum) ° 
天 键 字 entry 


将 不 再 使 用 。 

定义 了 字符 常量 和 字符 串 字 面值 中 使 用 的 新 转 义 字符 序列 。 
如 果 \ 及 其 后 字符 构成 的 不 是 转 义 序列 ， 则 其 结果 是 未 定义 的 。 参 见 
A.2.5 节 。 

所 有 人 都 喜欢 的 一 个 小 变化 :8 和 9 不 用 作 八 进 制 数字 。 


新 标准 引入 了 更 大 的 后 级 集合， 使 得 第 量 的 类 型 更 加 明确 :U 
或 工 用 于 整 型 ，F 或 工 


用 于 浮 点 数 。 它 同时 也 细 化 了 无 后 绥 常 量 类 型 的 相关 规则 (参见 A.2.5 
T) ° 


相 邻 的 字符 串 将 被 连接 在 一 起 。 


提供 了 宽 字 符 字 符 串 字面 值 和 字符 常量 的 表示 方法 ， 参 见 


A.2.6 Jie 

FRE RE, 对 字符 类 型 也 可 以 使 用 关键 字 signed 或 
unsigned ENAA 带 符 号 类 型 或 无 符号 类 型 。 放 弃 了 将 long float 作 
为 double 的 同义词 这 种 独特 
的 用 法 ， 但 可 以 用 long double 声明 更 高 精度 的 浮 点 数 。 


有 段 时 间 ，C 语言 中 可 以 使 用 unsigned char 类 型 。 新 标准 引 
入 了 关键 字 signed, 用 来 显 式 表 示 字 符 和 其 它 整 型 对 象 的 符号 。 


很 多 编译 器 在 几 年 前 就 实现 了 void 类 型 。 新 标准 引入 了 void 
* 类 型 ， 并 作为 一 种 通用 指针 类 型 ;在 此 之 前 char * 扮 演 着 这 一 角色 。 
同时 ， 明 确 地 规定 了 在 不 进行 强 


制 类 型 转换 的 情况 下 ， 指 针 与 整 型 之 间 以 及 不 同类 型 的 指针 之 间 运 全 
的 规则 。 


源 标 准 明确 指定 了 算术 类 型 取 值 范围 的 最 小 值 ， 并 在 两 个 头 
文件 (<limits.h> 和 


<floath>) 中 给 出 了 各 种 特定 实现 的 特性 。 
新 增加 的 枚 举 类 型 是 第 1 版 中 所 没有 的 。 


标准 采用 了 C++ 中 的 类 型 限定 符 的 概念 ， 如 const( 参 见 A.8.2 


字符 串 不 再 是 可 以 修改 的 ， 因 此 可 以 放 在 只 读 内 存 区 中 。 

修改 了 "普通 算术 类 型 转换 "， 特 别 地 ，" 整 型 总 是 转换 为 
unsigned 类 型 ， 浮 点 数 总 是 转换 为 double 类 型 "已 更 改 为 "提升 到 最 小 
的 足够 大 的 类 型 "。 人 参见 A.6.5 7 ° 

上 日 的 赋值 类 运算 符 ( 如 =+) 已 不 再 使 用 。 同 时 ， 赋 值 类 运算 符 现 
eal 在 第 1 版 中 ， 它 们 是 两 个 记号 ， 中 间 可 以 用 空白 符 分 

在 编译 器 中 ， 不 再 将 数学 上 可 结合 的 运算 符 当 做 计算 上 也 是 
可 结合 的 。 

为 了 保持 与 一 元 运算 符 。 的 对 称 ， 引 入 了 一 元 运算 符 +。 


JA EMSA ET A] LIVE A KRIET, Ne Ba CB 
算 符 。 参 见 A.7.3 Te 


结构 可 以 被 赋值 、 传 递 给 函数 以 及 被 男 数 返回 。 

人 允许 对 数组 应 用 地 址 运算 符 ， 其 结果 为 指 回 数组 的 指针 。 

在 第 1 版 中 ，sizeof 运算 符 的 结果 类 型 为 int， 但 随后 很 多 编 
译 器 的 实现 将 此 结果 作为 unsigned 类 型 。 标 准 明 确 了 该 运算 符 的 结 
类 型 与 具体 的 实现 有 关 ， 但 要 求 


将 其 类 型 size t 在 标准 头 文件 <stddef.h> 中 定义 。 关 于 两 个 指针 的 差 的 
结果 类 型 (ptrdiff_t) 也 有 类 似 的 变化 。 参 见 A.7.4 节 与 A.7.7 节 。 


地 址 运算 符 & 不 可 应 用 于 声明 为 register 的 对 象 ， 即 使 具体 的 
实现 未 将 这 种 对 象 存 放 在 寄存 硕 中 也 不 允许 使 用 地 址 运算 符 。 


移 位 表达 式 的 类 型 是 其 左 操作 数 的 类 型 ， 右 操作 数 不 能 提升 
结果 类 型 。 参 见 A.7.8 Te 


标准 允许 创建 一 个 指向 数组 最 后 一 个 元 素 的 下 一 个 位 置 的 指 
针 ， 并 人 允许 对 其 进行 算 术 和 关系 运算 。 参 见 A.7.7 T° 

标准 (借鉴 于 ”C++) 引 入 函数 原型 声明 的 表示 法 ， 男 数 原 
型 中 可 以 声明 变 元 的 类 型 。 同 时 ， 标 准 中 还 规定 了 显 式 声明 带 可 变 变 
元 表 的 函数 的 方法 ， 并 提供 了 一 种 被 


认可 的 处 理 可 变形 式 参 数 表 的 方法 。 参 见 A.7.3 © ` A.8.6 TA B.7 
节 。 旧 式 声明 的 函数 仍然 可 以 使 用 ， 但 有 一 定 限制 。 


标准 禁止 空 声 明 ， 即 没有 声明 符 ， 且 没有 至少 声 明 一 个 结 
构 ， 联 合 或 枚 举 的 声明 。 男 一 方面 ， 仪 仅 只 带 结 构 标 记 或 联合 标记 的 
声明 是 对 该 标记 的 重新 声明 ， 即 使 该 标 
记 声 明 在 外 层 作用 域 中 也 是 这 样 。 
禁止 没有 任何 说 明 符 或 限定 符 (只 是 一 个 空 的 声明 符 ) 的 外 部 数 


据说 明 


在 某 些 实现 中 ， 如 有 果 内 层 程 序 块 中 包含 一 个 exten 声明 ， 则 
该 声明 对 该 文件 的 其 它 部 分 可 见 。ANSI 标准 明确 规定 ， 这 种 声明 的 
作用 域 仅 为 该 程序 块 。 


形式 参数 的 作用 域 扩展 到 夯 数 的 复合 语句 中 ， 因 此 ， 画 数 中 
最 顶层 的 变量 声明 不 能 与 形式 参数 冲突 


标识 符 的 名 字 空 间 有 一 些 变化 。ANSI 标准 将 所 有 的 标号 放 在 
个 单独 的 名 字 空 间 中 ， 同时 也 为 标号 引入 了 一 个 单独 的 名 字 空 问 ， 参 
见 A.1.1 节 。 结 构 或 联合 的 成 员 名 将 与 
其 所 属 的 结构 或 联合 相关 联 (这 已 经 是 许多 实现 的 共同 做 法 了 ) 。 


联合 可 以 进行 初始 化 ， 初 值 引用 其 第 一 个 成 员 。 


目 动 结构 、 联 合 和 数组 可 以 进行 初始 化 ， 但 有 一 些 限 制 。 


显 式 指 定 长 度 的 字符 数组 可 以 用 与 此 长 度 相 同 的 字符 串 字 面 
值 初始 化 (不 包括 字符 


\0) ° 
switch 语句 的 控制 表达 式 和 case 标号 可 以 是 任意 整 型 。 
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B.11 与 县 体 实 现 相 关 的 限制 :<limits.h> 和 <floath> 


